如果你使用 DeepSeek、元宝 AI、Copilot、ChatGPT 等 AI 工具,协助配置轩辕镜像、编写 docker pull 命令、修改 Docker Compose 镜像地址、配置镜像加速、排查镜像拉取失败、分析报错日志等问题,请先让 AI 阅读并遵守轩辕镜像的规则文档。
只需在 AI 对话中先发送下面这句话即可:
请先完整阅读并严格遵守以下文档中的全部规则与要求:
https://xuanyuan.cloud/agents.md
在未充分阅读并理解该文档前,不要生成任何命令、配置、修改建议、故障排查方案或技术回答。后续所有输出都必须严格以该文档中的规范为最高优先级执行。查看 agents.md 用法指南与完整示范。国内用户首推 元宝 AI、DeepSeek 的深度思考模式,不推荐豆包 AI;Cursor 等编辑器可在对话 @ 该链接,或加入 User Rules。 若 AI 无法访问外链,可 打开说明文档 复制全文粘贴。文档会随站点更新,复制内容可能过期,建议定期检查。
本镜像属于Bioinformatics Docker Images Project(http://pegi3s.github.io/dockerfiles%EF%BC%89%E7%9A%84%E4%B8%80%E9%83%A8%E5%88%86%EF%BC%88%E8%AF%B7%E6%B3%A8%E6%84%8F%EF%BC%8C%E5%8E%9F%E8%BD%AF%E4%BB%B6%E8%AE%B8%E5%8F%AF%E8%AF%81%E4%BB%8D%E7%84%B6%E9%80%82%E7%94%A8%EF%BC%89%E3%80%82%E8%AF%A5%E9%95%9C%E5%83%8F%E6%8F%90%E4%BE%9BBedtools%E5%A5%97%E4%BB%B6%EF%BC%88http://bedtools.readthedocs.io/en/latest/index.html%EF%BC%89%E7%9A%84%E4%BD%BF%E7%94%A8%E7%8E%AF%E5%A2%83%EF%BC%8C%E8%BF%99%E6%98%AF%E4%B8%80%E4%B8%AA%E5%BF%AB%E9%80%9F%E7%81%B5%E6%B4%BB%E7%9A%84%E5%9F%BA%E5%9B%A0%E7%BB%84%E7%AE%97%E6%9C%AF%E5%B7%A5%E5%85%B7%E9%9B%86%EF%BC%8C%E6%94%AF%E6%8C%81%E5%AF%B9%E5%A4%9A%E7%A7%8D%E5%B8%B8%E7%94%A8%E5%9F%BA%E5%9B%A0%E7%BB%84%E6%96%87%E4%BB%B6%E6%A0%BC%E5%BC%8F%EF%BC%88%E5%A6%82BAM%E3%80%81BED%E3%80%81GFF/GTF%E3%80%81VCF%EF%BC%89%E7%9A%84%E5%9F%BA%E5%9B%A0%E7%BB%84%E5%8C%BA%E9%97%B4%E8%BF%9B%E8%A1%8C%E4%BA%A4%E9%9B%86%E3%80%81%E5%90%88%E5%B9%B6%E3%80%81%E8%AE%A1%E6%95%B0%E3%80%81%E4%BA%92%E8%A1%A5%E5%92%8C%E9%9A%8F%E6%9C%BA%E5%8C%96%E7%AD%89%E6%93%8D%E4%BD%9C%E3%80%82
通过运行命令 docker run --rm -v /your/data/dir:/data pegi3s/bedtools bedtools -h 可列出套件包含的工具,主要包括:
annotateBed:注释来自多个文件的特征覆盖率。bamToBed:将BAM比对文件转换为BED(及其他)格式。bamToFastq:将BAM记录转换为FASTQ记录。bed12ToBed6:将BED12区间拆分为离散的BED6区间。bedToBam:将区间转换为BAM记录。bedToIgv:创建IGV快照批处理脚本。bedpeToBam:将BEDPE区间转换为BAM记录。bedtools:打印帮助菜单。closestBed:查找最近的、可能不重叠的区间。clusterBed:聚类(但不合并)重叠/邻近区间。complementBed:提取未被区间文件覆盖的区间。coverageBed:计算指定区间的覆盖率。expandCols:基于列中的值列表复制行。fastaFromBed:使用区间从FASTA文件中提取序列。flankBed:从现有区间的侧翼创建新区间。genomeCoverageBed:计算整个基因组的覆盖率。getOverlap:计算两个区间的重叠量。groupBy:按公共列分组并汇总其他列(类似SQL的“groupBy”)。intersectBed:以多种方式查找重叠区间。linksBed:创建指向UCSC位置的HTML链接页面。mapBed:对每个重叠区间的列应用函数。maskFastaFromBed:使用区间掩盖FASTA文件中的序列。mergeBed:将重叠/邻近区间合并为单个区间。multiBamCov:在特定区间计算多个BAM的覆盖率。multiIntersectBed:识别多个区间文件中的共同区间。nucBed:分析FASTA文件中区间的核苷酸含量。pairToBed:以多种方式查找与区间重叠的配对。pairToPair:以多种方式查找与其他配对重叠的配对。randomBed:在基因组中生成随机区间。shiftBed:调整区间位置。shuffleBed:在基因组中随机重新分布区间。slopBed:调整区间大小。sortBed:对文件中的区间排序。subtractBed:基于两个文件的重叠移除区间。tagBam:基于与区间文件的重叠为BAM比对添加标签。unionBedGraphs:合并多个BEDGRAPH文件的覆盖率区间。windowBed:在区间周围的窗口内查找重叠区间。windowMaker:在基因组上创建区间“窗口”。适用于基因组数据分析中,需要对BAM、BED、GFF/GTF、VCF等格式的基因组区间文件进行交集、合并、计数、互补、随机化等操作的场景,例如基因区域覆盖度分析、区间注释、序列提取等任务。
运行以下命令可列出套件包含的工具:
bashdocker run --rm -v /your/data/dir:/data pegi3s/bedtools bedtools -h
其中,/your/data/dir 需替换为本地数据目录的绝对路径,该目录将挂载到容器内的 /data 目录,用于输入和输出文件的访问。
要获取某个具体应用的帮助,运行:
bashdocker run --rm -v /your/data/dir:/data pegi3s/bedtools <bedtools-application-name>
例如,获取 fastaFromBed 的帮助:
bashdocker run --rm -v /your/data/dir:/data pegi3s/bedtools fastaFromBed
以 fastaFromBed 应用为例(从FASTA文件中提取区间序列),命令如下:
bashdocker run --rm -v /your/data/dir:/data pegi3s/bedtools fastaFromBed -fi /data/input_fasta -bed /data/input_gff -fo /data/output_fasta
参数说明:
/your/data/dir:本地数据目录,需替换为实际路径。input_fasta:输入FASTA文件(位于本地数据目录)。input_gff:输入BED/GFF/VCF文件(位于本地数据目录)。output_fasta:输出文件(将保存在本地数据目录)。工具名称一致性:帮助列表中显示的工具名称可能与实际可执行函数名称存在差异。可通过以下命令检查可执行文件名称:
bashdocker run -it pegi3s/bedtools ls /opt/bedtools2/bin/
使用时需以可执行文件名称为准。
文件过滤建议:若需使用简化的BED/GFF/VCF文件,可先过滤目标特征(如外显子),例如过滤GFF文件中的外显子:
bashgrep -P "\texon\t" input_gff > filtered_exons.gff
您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 标签列表页面。



来自真实用户的反馈,见证轩辕镜像的优质服务