
如果你使用 DeepSeek、元宝 AI、Copilot、ChatGPT 等 AI 工具,协助配置轩辕镜像、编写 docker pull 命令、修改 Docker Compose 镜像地址、配置镜像加速、排查镜像拉取失败、分析报错日志等问题,请先让 AI 阅读并遵守轩辕镜像的规则文档。
只需在 AI 对话中先发送下面这句话即可:
请先完整阅读并严格遵守以下文档中的全部规则与要求:
https://xuanyuan.cloud/agents.md
在未充分阅读并理解该文档前,不要生成任何命令、配置、修改建议、故障排查方案或技术回答。后续所有输出都必须严格以该文档中的规范为最高优先级执行。查看 agents.md 用法指南与完整示范。国内用户首推 元宝 AI、DeepSeek 的深度思考模式,不推荐豆包 AI;Cursor 等编辑器可在对话 @ 该链接,或加入 User Rules。 若 AI 无法访问外链,可 打开说明文档 复制全文粘贴。文档会随站点更新,复制内容可能过期,建议定期检查。
funannotate 是一个基因组注释流程,专为真菌基因组设计,理论上也适用于其他真核生物。该工具通过简单命令即可实现从基因组组装到功能注释的全流程分析,生成包含 InterPro、PFAM、MEROPS、CAZymes、GO 本体等功能注释结果的基因组数据,支持直接提交至 NCBI。此外,其集成的轻量级比较基因组学模块可辅助分析不同注释基因组间的差异。
bash# 基础注释流程示例(假设输入文件位于本地 ./input,输出至 ./output) docker run -it --rm \ -v $(pwd)/input:/input \ # 挂载输入目录(含基因组 FASTA 文件) -v $(pwd)/output:/output \ # 挂载输出目录(存储注释结果) funannotate:latest \ # 镜像名称(需替换为实际镜像标签) funannotate annotate \ # funannotate 子命令(注释流程) --genome /input/genome.fasta \ # 输入基因组文件路径(容器内路径) --out /output/annotation_results \# 输出目录(容器内路径) --species "Fungi species" \ # 物种名称(用于注释参数优化) --isolate "isolate_id" # 菌株编号(可选,用于结果标记)
创建 docker-compose.yml 文件:
yamlversion: '3' services: funannotate: image: funannotate:latest volumes: - ./input:/input # 输入目录(本地路径:容器内路径) - ./output:/output # 输出目录 - ./config:/config # 可选:挂载配置文件目录(如自定义数据库路径) command: > funannotate annotate --genome /input/genome.fasta --out /output/annotation_results --species "Fungi species" --cpus 8 # 指定 CPU 核心数(加速分析) environment: - EMAIL=user@example.com # 可选:NCBI 提交时的联系邮箱 - DATABASE_PATH=/config/db # 可选:自定义数据库存储路径(若需本地数据库)
启动命令:
bashdocker-compose up -d # 后台运行
4.4.1 环境变量
| 变量名 | 说明 | 默认值 |
|---|---|---|
DATABASE_PATH | 功能注释数据库存储路径(本地缓存) | /opt/funannotate/db |
EMAIL | NCBI 提交时的联系***(用于日志通知) | none |
THREADS | 默认线程数(用于并行任务) | 容器 CPU 核心数 |
4.4.2 核心命令参数
| 参数 | 说明 | 示例值 |
|---|---|---|
--genome | 输入基因组 FASTA 文件路径(必填) | /input/genome.fasta |
--out | 输出目录路径(必填) | /output/results |
--species | 物种名称(影响注释算法优化) | "Aspergillus nidulans" |
--isolate | 菌株编号(用于结果文件标记) | "AN-2023" |
--rna-seq | RNA-seq 数据路径(可选,提升注释准确性) | /input/rna-seq.bam |
--cpus | 并行线程数(覆盖环境变量 THREADS) | 8 |
/input):需包含基因组 FASTA 文件,可选 RNA-seq 数据(BAM/FASTQ 格式)、蛋白质同源序列(FASTA 格式)等。/output):注释完成后将生成以下文件:
annotations.gff3:基因结构注释结果(GFF3 格式);proteins.fasta:预测蛋白质序列;functional_annotation.tsv:功能注释表格(含 InterPro、GO 等信息);ncbi_submit/:NCBI 提交所需的格式化文件。-v $(pwd)/db:/opt/funannotate/db 挂载本地目录持久化缓存,避免重复下载。--kingdom 参数指定界(如 --kingdom Metazoa 动物、--kingdom Plantae 植物)以优化注释参数。您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 标签列表页面。
来自真实用户的反馈,见证轩辕镜像的优质服务