
如果你使用 DeepSeek、元宝 AI、Copilot、ChatGPT 等 AI 工具,协助配置轩辕镜像、编写 docker pull 命令、修改 Docker Compose 镜像地址、配置镜像加速、排查镜像拉取失败、分析报错日志等问题,请先让 AI 阅读并遵守轩辕镜像的规则文档。
只需在 AI 对话中先发送下面这句话即可:
请先完整阅读并严格遵守以下文档中的全部规则与要求:
https://xuanyuan.cloud/agents.md
在未充分阅读并理解该文档前,不要生成任何命令、配置、修改建议、故障排查方案或技术回答。后续所有输出都必须严格以该文档中的规范为最高优先级执行。查看 agents.md 用法指南与完整示范。国内用户首推 元宝 AI、DeepSeek 的深度思考模式,不推荐豆包 AI;Cursor 等编辑器可在对话 @ 该链接,或加入 User Rules。 若 AI 无法访问外链,可 打开说明文档 复制全文粘贴。文档会随站点更新,复制内容可能过期,建议定期检查。
bacannot是一个易用的基于Nextflow的Docker化管道,采用最先进的软件进行原核生物基因组注释。它是多个工具的包装器,能够帮助更好地理解原核生物基因组,实现从基因组组装(若提供原始reads)到功能注释的全流程分析。
| 分析步骤 | 使用的软件或数据库 |
|---|---|
| 基因组组装(若提供原始reads) | https://github.com/fenderglass/Flye 和 https://github.com/rrwick/Unicycler |
| 识别最近的10个NCBI Refseq基因组 | https://github.com/phac-nml/refseq_masher |
| 通用注释和基因预测 | https://github.com/tseemann/prokka |
| rRNA预测 | https://github.com/tseemann/barrnap |
| 多位点序列分型(STs)分类 | https://github.com/tseemann/mlst |
| KEGG KO注释和可视化 | https://github.com/takaram/kofam_scan 和 https://github.com/bjtully/BioData/tree/master/KEGGDecoder |
| 甲基化注释 | https://github.com/jts/nanopolish |
| 抗菌(AMR)基因注释 | https://github.com/ncbi/amr/wiki%E3%80%81ARGminer%E3%80%81Resfinder 和 https://github.com/arpcard/rgi |
| 毒力基因注释 | Victors 和 VFDB |
| 前噬菌体序列和基因注释 | PHASTER 数据库、https://github.com/bobeobibo/phigaro 和 https://github.com/linsalrob/PhiSpy |
| 整合接合元件注释 | ICEberg |
| 质粒的计算机检测 | Plasmidfinder 和 https://github.com/oschwengers/platon |
| 基因组岛的预测和可视化 | https://github.com/brinkmanlab/islandpath 和 https://github.com/fmalmeida/gff-toolbox |
| 插入序列的重点检测 | https://github.com/janka2012/digIS |
| 注释结果合并 | bedtools |
| 结果在基因组浏览器中的渲染 | JBrowse |
| 自动报告和Shiny应用的渲染 | R Markdown 和 Shiny |
适用于微生物学、基因组学等领域的研究人员,需要对原核生物(如细菌)基因组进行全面注释分析,包括基因组结构解析、功能基因预测、耐药基因和毒力基因检测、代谢通路注释等场景,可应用于基础研究、临床诊断、流行病学调查等方向。
拉取Docker镜像
需拉取以下镜像(Nextflow也可在运行时自动下载):
bashdocker pull fmalmeida/bacannot:v2.3 docker pull fmalmeida/bacannot:v2.3_renv docker pull fmalmeida/bacannot:kofamscan docker pull fmalmeida/bacannot:jbrowse docker pull fmalmeida/bacannot:server # 用于Shiny解析器 docker pull fmalmeida/mpgap # 仅当使用原始reads作为输入时需要
安装Nextflow
bashcurl -s https://get.nextflow.io | bash
验证安装
bashnextflow run fmalmeida/bacannot --help
默认情况下,GitHub Actions每月第一天构建包含数据库的Docker镜像(fmalmeida/bacannot:v2.3)。用户可通过以下命令手动更新数据库镜像:
bashbash <(wget -O - -o /dev/null https://github.com/fmalmeida/bacannot/raw/master/bin/update_database_image.sh)
以下示例使用大肠杆菌参考基因组运行管道:
下载大肠杆菌参考基因组
bashwget -O ecoli_ref.fna.gz https://ftp.ncbi.nlm.nih.gov/genomes/all/GCF/000/008/865/GCF_000008865.2_ASM886v2/GCF_000008865.2_ASM886v2_genomic.fna.gz gzip -d ecoli_ref.fna.gz
运行管道
bashnextflow run fmalmeida/bacannot \ --prefix ecoli \ --genome ecoli_ref.fna \ --outdir _ANNOTATION \ --threads 4 \ --resfinder_species "Escherichia coli"
建议通过配置文件设置参数,运行时只需执行:
bashnextflow run fmalmeida/bacannot -c ./configuration-file
生成配置文件:
bashnextflow run fmalmeida/bacannot --get_config
通过NF tower(适用于云环境)
使用NF tower可快速自定义云环境配置并执行管道,支持通过表单输入参数。
通过nf-core launch(适用于本地执行)
pip install nf-core程序将在浏览器或命令行中打开交互式表单,配置完成后自动启动管道。bashnf-core launch fmalmeida/bacannot
Shiny服务器中报告和JBrowse标签指向旧样本
原因:浏览器数据存储和Cookie缓存。
解决:清除浏览器Cookie和数据缓存。
Shiny服务器中的JBrowse无法显示GC含量和甲基化图
解决:
jbrowse目录,执行http-server(需安装http-server);jbrowse/data文件夹。请使用Zenodo标签或GitHub URL引用本管道。同时,使用工具输出时请引用对应工具,工具列表见https://github.com/fmalmeida/bacannot/blob/master/markdown/list_of_tools.md%E3%80%82
您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 标签列表页面。
来自真实用户的反馈,见证轩辕镜像的优质服务