
如果你使用 DeepSeek、元宝 AI、Copilot、ChatGPT 等 AI 工具,协助配置轩辕镜像、编写 docker pull 命令、修改 Docker Compose 镜像地址、配置镜像加速、排查镜像拉取失败、分析报错日志等问题,请先让 AI 阅读并遵守轩辕镜像的规则文档。
只需在 AI 对话中先发送下面这句话即可:
请先完整阅读并严格遵守以下文档中的全部规则与要求:
https://xuanyuan.cloud/agents.md
在未充分阅读并理解该文档前,不要生成任何命令、配置、修改建议、故障排查方案或技术回答。后续所有输出都必须严格以该文档中的规范为最高优先级执行。查看 agents.md 用法指南与完整示范。国内用户首推 元宝 AI、DeepSeek 的深度思考模式,不推荐豆包 AI;Cursor 等编辑器可在对话 @ 该链接,或加入 User Rules。 若 AI 无法访问外链,可 打开说明文档 复制全文粘贴。文档会随站点更新,复制内容可能过期,建议定期检查。
本镜像集成了Variant Effect Predictor(VEP)工具及专用辅助脚本,主要用于基因组变异的功能注释及空VCF(Variant Call Format)文件的自动化处理。VEP是Ensembl开发的核心变异注释工具,可对DNA变异(如SNV、Indel等)进行基因、转录本、蛋白质水平的功能效应预测;辅助脚本则针对流程中可能出现的空VCF文件(如无变异样本产生的空文件)提供错误规避、标准化输出及日志记录功能,确保下游分析流程的连续性。
vep_install下载,或使用镜像内置基础缓存,物种及版本需与分析匹配)。4.2.1 镜像拉取
bashdocker pull [镜像仓库地址]/vep-empty-vcf-helper:latest # 需替换为实际镜像地址
4.2.2 单样本注释与空VCF处理(docker run)
命令格式:
bashdocker run -it --rm \ -v [本地数据目录]:/data \ # 挂载本地数据目录(含输入VCF及缓存) -v [本地缓存目录]:/vep_cache \ # 挂载VEP缓存目录(如人类GRCh38缓存) -e VEP_SPECIES=homo_sapiens \ # 配置物种(默认人类) -e VEP_ASSEMBLY=GRCh38 \ # 配置参考基因组版本 [镜像名称] \ /bin/bash -c "vep -i /data/input.vcf -o /data/output.vep.vcf --cache --dir /vep_cache && \ /scripts/empty_vcf_helper.sh -i /data/input.vcf -o /data/empty_vcf_report.txt"
参数说明:
-v [本地数据目录]:/data:本地数据目录需包含输入VCF文件,输出文件(如注释结果、报告)将写入此目录。-v [本地缓存目录]:/vep_cache:VEP缓存目录需包含物种对应的参考数据(如homo_sapiens/105_GRCh38)。vep命令参数:-i指定输入VCF,-o指定注释输出文件,--cache启用缓存模式,--dir指定缓存路径(容器内路径/vep_cache)。empty_vcf_helper.sh(辅助脚本)参数:-i输入VCF路径,-o空VCF处理报告输出路径。| 环境变量名 | 说明 | 默认值 |
|---|---|---|
VEP_SPECIES | 分析物种(如homo_sapiens、mus_musculus) | homo_sapiens |
VEP_ASSEMBLY | 参考基因组版本(如GRCh38、GRCh37) | GRCh38 |
VEP_CACHE_VERSION | VEP缓存版本(如105) | 105 |
HELPER_LOG_LEVEL | 辅助脚本日志级别(INFO/DEBUG) | INFO |
辅助脚本empty_vcf_helper.sh支持以下参数:
| 参数 | 类型 | 说明 | 必需 |
|---|---|---|---|
-i | 路径 | 输入VCF文件路径(容器内路径,如/data/input.vcf) | 是 |
-o | 路径 | 空VCF处理报告输出路径 | 是 |
--force | 标志 | 强制覆盖已存在的输出报告 | 否 |
--min-rows | 整数 | 空文件判断阈值(非表头行数<此值视为空文件,默认0) | 否 |
适用于多样本批量处理场景,通过docker-compose.yml定义数据挂载、环境变量及命令:
yamlversion: '3' services: vep_analysis: image: [镜像仓库地址]/vep-empty-vcf-helper:latest volumes: - ./local_data:/data # 本地数据目录(输入VCF、输出结果) - ./vep_cache:/vep_cache # VEP缓存目录 environment: - VEP_SPECIES=homo_sapiens - VEP_ASSEMBLY=GRCh38 - VEP_CACHE_VERSION=105 command: > /bin/bash -c "for vcf in /data/*.vcf; do sample_name=\$(basename \$vcf .vcf); vep -i \$vcf -o /data/\${sample_name}_vep.vcf --cache --dir /vep_cache; /scripts/empty_vcf_helper.sh -i \$vcf -o /data/\${sample_name}_empty_report.txt; done"
说明:上述配置会批量处理./local_data目录下的所有.vcf文件,分别生成注释结果(*_vep.vcf)和空VCF报告(*_empty_report.txt)。
缓存数据:VEP缓存需与物种、参考基因组版本匹配(如人类GRCh38需对应homo_sapiens/105_GRCh38目录),可通过vep_install工具提前下载(https://www.ensembl.org/info/docs/tools/vep/script/vep_download.html%EF%BC%89%E3%80%82
空VCF定义:辅助脚本默认将“非表头行数=0”的文件判定为空VCF,可通过--min-rows参数调整阈值(如设为10,非表头行数<10视为“近空”文件)。
权限问题:本地挂载目录需确保Docker用户有读写权限(可通过chmod 775 local_data调整)。
注:辅助脚本的具体功能及参数可能因镜像版本略有差异,建议通过docker run --rm [镜像名称] /scripts/empty_vcf_helper.sh -h查看内置帮助文档。
您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 标签列表页面。
来自真实用户的反馈,见证轩辕镜像的优质服务