
如果你使用 DeepSeek、元宝 AI、Copilot、ChatGPT 等 AI 工具,协助配置轩辕镜像、编写 docker pull 命令、修改 Docker Compose 镜像地址、配置镜像加速、排查镜像拉取失败、分析报错日志等问题,请先让 AI 阅读并遵守轩辕镜像的规则文档。
只需在 AI 对话中先发送下面这句话即可:
请先完整阅读并严格遵守以下文档中的全部规则与要求:
https://xuanyuan.cloud/agents.md
在未充分阅读并理解该文档前,不要生成任何命令、配置、修改建议、故障排查方案或技术回答。后续所有输出都必须严格以该文档中的规范为最高优先级执行。查看 agents.md 用法指南与完整示范。国内用户首推 元宝 AI、DeepSeek 的深度思考模式,不推荐豆包 AI;Cursor 等编辑器可在对话 @ 该链接,或加入 User Rules。 若 AI 无法访问外链,可 打开说明文档 复制全文粘贴。文档会随站点更新,复制内容可能过期,建议定期检查。
Delly 是一种集成的结构变异(SV)预测方法,能够在短读长大规模并行测序数据中以单核苷酸分辨率发现、基因分型和可视化缺失、串联重复、倒位和易位。它使用配对末端、分裂读取和读取深度来敏感且准确地描绘整个基因组的基因组重排。结构变异可使用 https://github.com/dellytools/maze 和 https://github.com/dellytools/suave 进行可视化。
基本 Docker 运行命令
bashdocker run -v /path/to/data:/data dellytools/delly delly call -x /data/hg19.excl -o /data/delly.bcf -g /data/hg19.fa /data/input.bam
Docker Compose 配置示例
yamlversion: '3' services: delly: image: dellytools/delly volumes: - /path/to/local/data:/data environment: - OMP_NUM_THREADS=4 command: delly call -x /data/hg19.excl -o /data/delly.bcf -g /data/hg19.fa /data/input.bam
Delly支持使用OpenMP API进行并行计算,通过以下方式启用:
bash# 设置线程数环境变量 export OMP_NUM_THREADS=4 # 或在Docker运行时设置 docker run -e OMP_NUM_THREADS=4 dellytools/delly ...
注意:OMP_NUM_THREADS 应始终小于或等于输入样本的数量,因为Delly主要在样本级别进行并行化。
标准结构变异检测
bashdelly call -x <排除区域文件> -o <输出文件.bcf> -g <参考基因组.fa> <输入.bam>
示例:
bashdocker run -v $(pwd):/data dellytools/delly delly call -x /data/hg19.excl -o /data/delly.bcf -g /data/hg19.fa /data/input.bam # 转换为VCF格式(需要BCFtools) bcftools view /data/delly.bcf > /data/delly.vcf
长读长模式(PacBio或ONT)
ONT数据:
bashdocker run -v $(pwd):/data dellytools/delly delly lr -y ont -g /data/hg19.fa -x /data/hg19.excl /data/input.bam
PacBio数据:
bashdocker run -v $(pwd):/data dellytools/delly delly lr -y pb -g /data/hg19.fa -x /data/hg19.excl /data/input.bam
体细胞结构变异检测流程
bashdocker run -v $(pwd):/data dellytools/delly delly call -x /data/hg19.excl -o /data/t1.bcf -g /data/hg19.fa /data/tumor1.bam /data/control1.bam
bash# 样本描述文件格式(samples.tsv): # sample_id type # tumor1 tumor # control1 control docker run -v $(pwd):/data dellytools/delly delly filter -f somatic -o /data/t1.pre.bcf -s /data/samples.tsv /data/t1.bcf
bashdocker run -v $(pwd):/data dellytools/delly delly call -g /data/hg19.fa -v /data/t1.pre.bcf -o /data/geno.bcf -x /data/hg19.excl /data/tumor1.bam /data/control1.bam ... /data/controlN.bam
bashdocker run -v $(pwd):/data dellytools/delly delly filter -f somatic -o /data/t1.somatic.bcf -s /data/samples.tsv /data/geno.bcf
生殖系结构变异检测流程
bashdocker run -v $(pwd):/data dellytools/delly delly call -g /data/hg19.fa -o /data/s1.bcf -x /data/hg19.excl /data/sample1.bam
bashdocker run -v $(pwd):/data dellytools/delly delly merge -o /data/sites.bcf /data/s1.bcf /data/s2.bcf ... /data/sN.bcf
bashdocker run -v $(pwd):/data dellytools/delly delly call -g /data/hg19.fa -v /data/sites.bcf -o /data/s1.geno.bcf -x /data/hg19.excl /data/s1.bam
bashbcftools merge -m id -O b -o merged.bcf s1.geno.bcf s2.geno.bcf ... sN.geno.bcf
bashdocker run -v $(pwd):/data dellytools/delly delly filter -f germline -o /data/germline.bcf /data/merged.bcf
bashdocker run -v $(pwd):/data dellytools/delly delly rd -a -g /data/hg19.fa -m /data/hg19.map /data/input.bam
bashRscript R/rd.R out.cov.gz
bashdocker run -v $(pwd):/data dellytools/delly delly rd -s /data/stats.gz -g /data/hg19.fa -m /data/hg19.map /data/input.bam zgrep "^GC" stats.gz > gc.table Rscript R/gcbias.R gc.table
| 参数 | 描述 |
|---|---|
-g | 索引的参考基因组FASTA文件 |
-x | 排除区域文件(例如着丝粒、端粒区域) |
-o | 输出文件路径 |
-v | 输入的变异位点文件(用于基因分型) |
-f | 过滤模式(somatic或germline) |
-s | 样本描述文件(用于体细胞过滤) |
-y | 长读长技术类型(ont或pb) |
-a | 生成所有窗口的覆盖度,不仅是潜在的SV区域 |
-m | 可映射性图谱文件 |
Q: Delly能检测的最小SV大小是多少?
A: 这取决于插入大小分布的锐度。对于200-300bp的插入大小和20-30bp的标准偏差,Delly开始检测≥300bp的可靠SV。Delly还支持仅使用软剪辑读取调用小的InDel,最小可检测15bp的SV。
Q: Delly可以用于非二倍体基因组吗?
A: 部分支持。SV位点发现适用于任何倍性。然而,Delly的基因分型模型假设二倍体(纯合参考、杂合和纯合替代)。
Q: Delly运行太慢,有什么解决方法?
A: 应排除端粒和着丝粒区域以及所有未放置的contigs。Delly为人和小鼠样本提供了此类排除列表。此外,可以使用-q 20和-s 15更严格地过滤输入读取。
Q: 是否允许非唯一比对、多重映射和/或多重分裂读取比对?
A: Delly期望每个配对末端在bam文件中有两个比对记录,一个用于第一个读取,一个用于第二个读取。给定读取的多个分裂读取比对记录是允许的,前提是其中一个是主要比对,而所有其他的被标记为次要或补充(flag 0x0100或flag 0x0800)。这是bwa mem的默认行为。
Q: BAM文件需要哪些预处理?
A: BAM文件需要排序、索引,理想情况下还需要重复标记。
Tobias Rausch, Thomas Zichner, Andreas Schlattl, Adrian M. Stuetz, Vladimir Benes, Jan O. Korbel.
DELLY: structural variant discovery by integrated paired-end and split-read analysis.
Bioinformatics. 2012 Sep 15;28(18):i333-i339.
[***]
Delly 根据BSD 3-Clause许可证分发。有关更多详情,请参阅https://github.com/dellytools/delly/blob/master/LICENSE%E6%96%87%E4%BB%B6%E3%80%82
您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 标签列表页面。
来自真实用户的反馈,见证轩辕镜像的优质服务