pegi3s/bedtools本镜像属于Bioinformatics Docker Images Project([***]
通过运行命令 docker run --rm -v /your/data/dir:/data pegi3s/bedtools bedtools -h 可列出套件包含的工具,主要包括:
annotateBed:注释来自多个文件的特征覆盖率。bamToBed:将BAM比对文件转换为BED(及其他)格式。bamToFastq:将BAM记录转换为FASTQ记录。bed12ToBed6:将BED12区间拆分为离散的BED6区间。bedToBam:将区间转换为BAM记录。bedToIgv:创建IGV快照批处理脚本。bedpeToBam:将BEDPE区间转换为BAM记录。bedtools:打印帮助菜单。closestBed:查找最近的、可能不重叠的区间。clusterBed:聚类(但不合并)重叠/邻近区间。complementBed:提取未被区间文件覆盖的区间。coverageBed:计算指定区间的覆盖率。expandCols:基于列中的值列表复制行。fastaFromBed:使用区间从FASTA文件中提取序列。flankBed:从现有区间的侧翼创建新区间。genomeCoverageBed:计算整个基因组的覆盖率。getOverlap:计算两个区间的重叠量。groupBy:按公共列分组并汇总其他列(类似SQL的“groupBy”)。intersectBed:以多种方式查找重叠区间。linksBed:创建指向UCSC位置的HTML链接页面。mapBed:对每个重叠区间的列应用函数。maskFastaFromBed:使用区间掩盖FASTA文件中的序列。mergeBed:将重叠/邻近区间合并为单个区间。multiBamCov:在特定区间计算多个BAM的覆盖率。multiIntersectBed:识别多个区间文件中的共同区间。nucBed:分析FASTA文件中区间的核苷酸含量。pairToBed:以多种方式查找与区间重叠的配对。pairToPair:以多种方式查找与其他配对重叠的配对。randomBed:在基因组中生成随机区间。shiftBed:调整区间位置。shuffleBed:在基因组中随机重新分布区间。slopBed:调整区间大小。sortBed:对文件中的区间排序。subtractBed:基于两个文件的重叠移除区间。tagBam:基于与区间文件的重叠为BAM比对添加标签。unionBedGraphs:合并多个BEDGRAPH文件的覆盖率区间。windowBed:在区间周围的窗口内查找重叠区间。windowMaker:在基因组上创建区间“窗口”。适用于基因组数据分析中,需要对BAM、BED、GFF/GTF、VCF等格式的基因组区间文件进行交集、合并、计数、互补、随机化等操作的场景,例如基因区域覆盖度分析、区间注释、序列提取等任务。
运行以下命令可列出套件包含的工具:
bashdocker run --rm -v /your/data/dir:/data pegi3s/bedtools bedtools -h
其中,/your/data/dir 需替换为本地数据目录的绝对路径,该目录将挂载到容器内的 /data 目录,用于输入和输出文件的访问。
要获取某个具体应用的帮助,运行:
bashdocker run --rm -v /your/data/dir:/data pegi3s/bedtools <bedtools-application-name>
例如,获取 fastaFromBed 的帮助:
bashdocker run --rm -v /your/data/dir:/data pegi3s/bedtools fastaFromBed
以 fastaFromBed 应用为例(从FASTA文件中提取区间序列),命令如下:
bashdocker run --rm -v /your/data/dir:/data pegi3s/bedtools fastaFromBed -fi /data/input_fasta -bed /data/input_gff -fo /data/output_fasta
参数说明:
/your/data/dir:本地数据目录,需替换为实际路径。input_fasta:输入FASTA文件(位于本地数据目录)。input_gff:输入BED/GFF/VCF文件(位于本地数据目录)。output_fasta:输出文件(将保存在本地数据目录)。工具名称一致性:帮助列表中显示的工具名称可能与实际可执行函数名称存在差异。可通过以下命令检查可执行文件名称:
bashdocker run -it pegi3s/bedtools ls /opt/bedtools2/bin/
使用时需以可执行文件名称为准。
文件过滤建议:若需使用简化的BED/GFF/VCF文件,可先过滤目标特征(如外显子),例如过滤GFF文件中的外显子:
bashgrep -P "\texon\t" input_gff > filtered_exons.gff
manifest unknown 错误
TLS 证书验证失败
DNS 解析超时
410 错误:版本过低
402 错误:流量耗尽
身份认证失败错误
429 限流错误
凭证保存错误
来自真实用户的反馈,见证轩辕镜像的优质服务