Delly 是一种集成的结构变异(SV)预测方法,能够在短读长大规模并行测序数据中以单核苷酸分辨率发现、基因分型和可视化缺失、串联重复、倒位和易位。它使用配对末端、分裂读取和读取深度来敏感且准确地描绘整个基因组的基因组重排。结构变异可使用 Delly-maze 和 Delly-suave 进行可视化。
bashdocker run -v /path/to/data:/data dellytools/delly delly call -x /data/hg19.excl -o /data/delly.bcf -g /data/hg19.fa /data/input.bam
yamlversion: '3' services: delly: image: dellytools/delly volumes: - /path/to/local/data:/data environment: - OMP_NUM_THREADS=4 command: delly call -x /data/hg19.excl -o /data/delly.bcf -g /data/hg19.fa /data/input.bam
Delly支持使用OpenMP API进行并行计算,通过以下方式启用:
bash# 设置线程数环境变量 export OMP_NUM_THREADS=4 # 或在Docker运行时设置 docker run -e OMP_NUM_THREADS=4 dellytools/delly ...
注意:OMP_NUM_THREADS 应始终小于或等于输入样本的数量,因为Delly主要在样本级别进行并行化。
bashdelly call -x <排除区域文件> -o <输出文件.bcf> -g <参考基因组.fa> <输入.bam>
示例:
bashdocker run -v $(pwd):/data dellytools/delly delly call -x /data/hg19.excl -o /data/delly.bcf -g /data/hg19.fa /data/input.bam # 转换为VCF格式(需要BCFtools) bcftools view /data/delly.bcf > /data/delly.vcf
ONT数据:
bashdocker run -v $(pwd):/data dellytools/delly delly lr -y ont -g /data/hg19.fa -x /data/hg19.excl /data/input.bam
PacBio数据:
bashdocker run -v $(pwd):/data dellytools/delly delly lr -y pb -g /data/hg19.fa -x /data/hg19.excl /data/input.bam
bashdocker run -v $(pwd):/data dellytools/delly delly call -x /data/hg19.excl -o /data/t1.bcf -g /data/hg19.fa /data/tumor1.bam /data/control1.bam
bash# 样本描述文件格式(samples.tsv): # sample_id type # tumor1 tumor # control1 control docker run -v $(pwd):/data dellytools/delly delly filter -f somatic -o /data/t1.pre.bcf -s /data/samples.tsv /data/t1.bcf
bashdocker run -v $(pwd):/data dellytools/delly delly call -g /data/hg19.fa -v /data/t1.pre.bcf -o /data/geno.bcf -x /data/hg19.excl /data/tumor1.bam /data/control1.bam ... /data/controlN.bam
bashdocker run -v $(pwd):/data dellytools/delly delly filter -f somatic -o /data/t1.somatic.bcf -s /data/samples.tsv /data/geno.bcf
bashdocker run -v $(pwd):/data dellytools/delly delly call -g /data/hg19.fa -o /data/s1.bcf -x /data/hg19.excl /data/sample1.bam
bashdocker run -v $(pwd):/data dellytools/delly delly merge -o /data/sites.bcf /data/s1.bcf /data/s2.bcf ... /data/sN.bcf
bashdocker run -v $(pwd):/data dellytools/delly delly call -g /data/hg19.fa -v /data/sites.bcf -o /data/s1.geno.bcf -x /data/hg19.excl /data/s1.bam
bashbcftools merge -m id -O b -o merged.bcf s1.geno.bcf s2.geno.bcf ... sN.geno.bcf
bashdocker run -v $(pwd):/data dellytools/delly delly filter -f germline -o /data/germline.bcf /data/merged.bcf
bashdocker run -v $(pwd):/data dellytools/delly delly rd -a -g /data/hg19.fa -m /data/hg19.map /data/input.bam
bashRscript R/rd.R out.cov.gz
bashdocker run -v $(pwd):/data dellytools/delly delly rd -s /data/stats.gz -g /data/hg19.fa -m /data/hg19.map /data/input.bam zgrep "^GC" stats.gz > gc.table Rscript R/gcbias.R gc.table
| 参数 | 描述 |
|---|---|
-g | 索引的参考基因组FASTA文件 |
-x | 排除区域文件(例如着丝粒、端粒区域) |
-o | 输出文件路径 |
-v | 输入的变异位点文件(用于基因分型) |
-f | 过滤模式(somatic或germline) |
-s | 样本描述文件(用于体细胞过滤) |
-y | 长读长技术类型(ont或pb) |
-a | 生成所有窗口的覆盖度,不仅是潜在的SV区域 |
-m | 可映射性图谱文件 |
Q: Delly能检测的最小SV大小是多少?
A: 这取决于插入大小分布的锐度。对于200-300bp的插入大小和20-30bp的标准偏差,Delly开始检测≥300bp的可靠SV。Delly还支持仅使用软剪辑读取调用小的InDel,最小可检测15bp的SV。
Q: Delly可以用于非二倍体基因组吗?
A: 部分支持。SV位点发现适用于任何倍性。然而,Delly的基因分型模型假设二倍体(纯合参考、杂合和纯合替代)。
Q: Delly运行太慢,有什么解决方法?
A: 应排除端粒和着丝粒区域以及所有未放置的contigs。Delly为人和小鼠样本提供了此类排除列表。此外,可以使用-q 20和-s 15更严格地过滤输入读取。
Q: 是否允许非唯一比对、多重映射和/或多重分裂读取比对?
A: Delly期望每个配对末端在bam文件中有两个比对记录,一个用于第一个读取,一个用于第二个读取。给定读取的多个分裂读取比对记录是允许的,前提是其中一个是主要比对,而所有其他的被标记为次要或补充(flag 0x0100或flag 0x0800)。这是bwa mem的默认行为。
Q: BAM文件需要哪些预处理?
A: BAM文件需要排序、索引,理想情况下还需要重复标记。
Tobias Rausch, Thomas Zichner, Andreas Schlattl, Adrian M. Stuetz, Vladimir Benes, Jan O. Korbel.
DELLY: structural variant discovery by integrated paired-end and split-read analysis.
Bioinformatics. 2012 Sep 15;28(18):i333-i339.
[***]
Delly 根据BSD 3-Clause许可证分发。有关更多详情,请参阅LICENSE文件。
来自真实用户的反馈,见证轩辕镜像的优质服务
免费版仅支持 Docker Hub 加速,不承诺可用性和速度;专业版支持更多镜像源,保证可用性和稳定速度,提供优先客服响应。
免费版仅支持 docker.io;专业版支持 docker.io、gcr.io、ghcr.io、registry.k8s.io、nvcr.io、quay.io、mcr.microsoft.com、docker.elastic.co 等。
当返回 402 Payment Required 错误时,表示流量已耗尽,需要充值流量包以恢复服务。
通常由 Docker 版本过低导致,需要升级到 20.x 或更高版本以支持 V2 协议。
先检查 Docker 版本,版本过低则升级;版本正常则验证镜像信息是否正确。
使用 docker tag 命令为镜像打上新标签,去掉域名前缀,使镜像名称更简洁。
探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式
通过 Docker 登录认证访问私有仓库
在 Linux 系统配置镜像加速服务
在 Docker Desktop 配置镜像加速
Docker Compose 项目配置加速
Kubernetes 集群配置 Containerd
在宝塔面板一键配置镜像加速
Synology 群晖 NAS 配置加速
飞牛 fnOS 系统配置镜像加速
极空间 NAS 系统配置加速服务
爱快 iKuai 路由系统配置加速
绿联 NAS 系统配置镜像加速
QNAP 威联通 NAS 配置加速
Podman 容器引擎配置加速
HPC 科学计算容器配置加速
ghcr、Quay、nvcr 等镜像仓库
无需登录使用专属域名加速
需要其他帮助?请查看我们的 常见问题 或 官方QQ群: 13763429