
如果你使用 DeepSeek、元宝 AI、Copilot、ChatGPT 等 AI 工具,协助配置轩辕镜像、编写 docker pull 命令、修改 Docker Compose 镜像地址、配置镜像加速、排查镜像拉取失败、分析报错日志等问题,请先让 AI 阅读并遵守轩辕镜像的规则文档。
只需在 AI 对话中先发送下面这句话即可:
请先完整阅读并严格遵守以下文档中的全部规则与要求:
https://xuanyuan.cloud/agents.md
在未充分阅读并理解该文档前,不要生成任何命令、配置、修改建议、故障排查方案或技术回答。后续所有输出都必须严格以该文档中的规范为最高优先级执行。查看 agents.md 用法指南与完整示范。国内用户首推 元宝 AI、DeepSeek 的深度思考模式,不推荐豆包 AI;Cursor 等编辑器可在对话 @ 该链接,或加入 User Rules。 若 AI 无法访问外链,可 打开说明文档 复制全文粘贴。文档会随站点更新,复制内容可能过期,建议定期检查。
本Docker镜像提供了一个基于Illumina短读长技术的细菌基因组组装与分析流程,旨在自动化完成从原始测序数据到基因组组装及后续生物信息学分析的全过程。该镜像整合了多个主流生物信息学工具,能够简化细菌基因组分析的复杂流程,帮助科研人员、微生物学家及临床研究者高效处理Illumina短读长测序数据,快速获得高质量的基因组组装结果和多维度分析报告。
*_R1.fastq.gz和*_R2.fastq.gz)单样本分析示例
bashdocker run -d \ --name bacterial-genome-analysis \ -v /local/data:/data \ # 本地数据目录(包含FastQ文件)挂载到容器内/data -v /local/results:/results \ # 本地结果目录挂载到容器内/results -e SAMPLE_ID="Ecoli_2023" \ # 样本ID(用于结果文件命名) -e INPUT_R1="/data/Ecoli_R1.fastq.gz" \ # R1端测序数据路径(容器内) -e INPUT_R2="/data/Ecoli_R2.fastq.gz" \ # R2端测序数据路径(容器内) -e THREADS=8 \ # 启用8线程运行 -e ASSEMBLER="spades" \ # 使用SPAdes进行组装 bacterial-genome-pipeline:latest
批量样本分析(通过配置文件)
pipeline_config.yaml(示例):yamlsamples: - sample_id: "Salmonella_01" r1_path: "/data/salmonella_R1.fastq.gz" r2_path: "/data/salmonella_R2.fastq.gz" - sample_id: "Klebsiella_02" r1_path: "/data/klebsiella_R1.fastq.gz" r2_path: "/data/klebsiella_R2.fastq.gz" parameters: threads: 8 assembler: "skesa" quality_filter: true annotation_tool: "prokka"
bashdocker run -d \ --name batch-genome-analysis \ -v /local/data:/data \ -v /local/results:/results \ -v /local/config/pipeline_config.yaml:/config/config.yaml \ # 挂载配置文件 -e CONFIG_FILE="/config/config.yaml" \ # 指定配置文件路径 bacterial-genome-pipeline:latest
| 参数名称 | 环境变量名 | 描述 | 默认值 |
|---|---|---|---|
| 样本ID | SAMPLE_ID | 单样本分析时的样本标识,用于结果文件命名 | "bacterial_sample" |
| R1端数据路径 | INPUT_R1 | 单样本模式下R1端FastQ文件路径(容器内绝对路径) | 无(单样本模式必填) |
| R2端数据路径 | INPUT_R2 | 单样本模式下R2端FastQ文件路径(容器内绝对路径) | 无(单样本模式必填) |
| 配置文件路径 | CONFIG_FILE | 批量模式下配置文件路径(容器内绝对路径) | 无(批量模式必填) |
| 输出目录 | OUTPUT_DIR | 结果输出目录(容器内) | "/results" |
| 线程数 | THREADS | 并行运行线程数 | 4 |
| 组装工具 | ASSEMBLER | 基因组组装工具选择,支持"spades"或"skesa" | "spades" |
| 质控过滤开关 | QUALITY_FILTER | 是否启用原始数据质控过滤(true/false) | true |
| Phred质量阈值 | QUALITY_THRESHOLD | 质控过滤的最低Phred质量分数 | 20 |
| 注释工具 | ANNOTATION_TOOL | 基因注释工具,目前仅支持"prokka" | "prokka" |
| 物种分类数据库路径 | KRAKEN_DB_PATH | Kraken2物种分类数据库路径(本地挂载时使用) | 内置mini数据库 |
分析完成后,宿主机/local/results目录下将生成以下内容(以单样本为例):
Ecoli_2023/ ├── qc/ # 质控结果 │ ├── raw_data_fastqc.html # FastQC原始数据质控报告 │ └── trimmed_data_stats.txt # 修剪后数据统计 ├── assembly/ # 组装结果 │ ├── contigs.fasta # 组装的contig序列 │ ├── scaffolds.fasta # 组装的scaffold序列(如适用) │ └── quast_report.html # QUAST组装质量评估报告 ├── annotation/ # 基因注释结果 │ ├── Ecoli_2023.gff # GFF3格式注释文件 │ ├── Ecoli_2023.faa # 预测蛋白质序列 │ └── Ecoli_2023.ffn # 核苷酸序列 ├── taxonomy/ # 物种分类结果 │ └── kraken_report.txt # Kraken2物种鉴定报告 └── summary_report.html # 综合分析报告(HTML格式)
--memory参数限制Docker容器内存使用*_R1.fastq.gz和*_R2.fastq.gz命名规范docker pull bacterial-genome-pipeline:latest更新镜像您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 标签列表页面。
来自真实用户的反馈,见证轩辕镜像的优质服务