本站面向开发者与科研用户,提供开源镜像的搜索和下载加速服务。
所有镜像均来源于原始开源仓库,本站不存储、不修改、不传播任何镜像内容。

ensembl-vep Docker 镜像下载 - 轩辕镜像

ensembl-vep 镜像详细信息和使用指南

ensembl-vep 镜像标签列表和版本信息

ensembl-vep 镜像拉取命令和加速下载

ensembl-vep 镜像使用说明和配置指南

Docker 镜像加速服务 - 轩辕镜像平台

国内开发者首选的 Docker 镜像加速平台

极速拉取 Docker 镜像服务

相关 Docker 镜像推荐

热门 Docker 镜像下载

ensembl-vep
ensemblorg/ensembl-vep
自动构建

ensembl-vep 镜像详细信息

ensembl-vep 镜像标签列表

ensembl-vep 镜像使用说明

ensembl-vep 镜像拉取命令

Docker 镜像加速服务

轩辕镜像平台优势

镜像下载指南

相关 Docker 镜像推荐

该镜像包含VEP(预测基因组变异功能影响)、Haplosaurus(利用相位基因型数据预测全转录本单倍型序列)和Variant Recoder(在不同变异编码间转换)三个工具,用于基因组变异分析。
18 收藏0 次下载activeensemblorg镜像

ensembl-vep 镜像详细说明

ensembl-vep 使用指南

ensembl-vep 配置说明

ensembl-vep 官方文档

ensembl-vep 镜像文档

![GitHub]([] ![Docker Build Status]([] ![Docker Hub Pulls]([***]

镜像概述

ensembl-vep 镜像集成了三个核心工具,用于基因组变异分析:

  • VEP(Variant Effect Predictor):预测基因组变异的功能影响
  • Haplosaurus:利用相位基因型数据预测全转录本单倍型序列
  • Variant Recoder:在不同变异编码格式间进行转换

该镜像已预装所有依赖组件,可直接部署使用,避免复杂的环境配置,适用于基因组学研究和临床变异分析场景。

核心功能与特性

VEP

  • 预测基因组变异(如SNV、indel等)对基因、转录本和蛋白质的潜在功能影响
  • 支持多种输入格式(VCF、变异ID、HGVS等)
  • 可结合Ensembl数据库或本地缓存进行离线分析

Haplosaurus

  • 基于相位基因型数据构建转录本的单倍型序列(DNA和蛋白质水平)
  • 与参考序列比对并生成类似HGVS的变异命名
  • 考虑变异的组合效应,优于独立变异分析

Variant Recoder

  • 在不同变异编码格式间转换(如HGVS、变异ID、SPDI等)
  • 支持多种输入格式(VCF、变异ID、HGVS)
  • 输出包括Ensembl、RefSeq和LRG序列的变异注释

使用场景

  • 基因组变异功能注释:对测序数据中的变异进行功能影响预测(如错义突变、无义突变等)
  • 单倍型分析:研究转录本水平的单倍型序列及其蛋白质产物
  • 变异数据标准化:在不同变异表示格式间转换,统一数据分析流程
  • 临床变异解读:辅助解读肿瘤、遗传病等相关变异的潜在影响

安装与准备

镜像拉取

bash
docker pull ensemblorg/ensembl-vep

数据准备

  • 分析数据(如VCF文件)需挂载到容器内方可访问
  • 若使用本地缓存,需提前下载并挂载缓存目录(可通过VEP的INSTALL.pl脚本下载)

使用方法

VEP

基本用法

bash
# 基本变异注释(离线模式,使用缓存)
docker run --rm -v /本地数据目录:/data ensemblorg/ensembl-vep vep \
  -i /data/input.vcf \
  -o /data/output.txt \
  --offline \
  --cache

# 自定义输出格式(添加HGVS注释)
docker run --rm -v /本地数据目录:/data ensemblorg/ensembl-vep vep \
  -i /data/input.vcf \
  -o /data/output_hgvs.txt \
  --hgvs \
  --offline \
  --cache

主要参数

  • -i/--input_file:输入文件路径(VCF或其他支持格式)
  • -o/--output_file:输出文件路径
  • --offline:离线模式(需配合--cache使用本地缓存)
  • --cache:使用本地缓存数据
  • --hgvs:输出HGVS格式注释
  • --species:指定物种(默认:homo_sapiens)
  • --assembly:指定参考基因组版本(如GRCh37、GRCh38)

Haplosaurus

基本用法

bash
# 单倍型预测(使用缓存)
docker run --rm -v /本地数据目录:/data ensemblorg/ensembl-vep haplo \
  -i /data/phased_input.vcf \
  -o /data/haplo_output.txt \
  --cache

输入要求

  • 输入VCF文件必须包含相位基因型数据(如|分隔的等位基因)
  • 文件需按染色体和基因组位置排序

输出格式

默认输出为制表符分隔文件,包含以下字段:

  1. 转录本稳定ID
  2. CDS单倍型名称
  3. CDS单倍型标记(逗号分隔)
  4. 蛋白质单倍型名称
  5. 蛋白质单倍型标记(逗号分隔)
  6. 蛋白质单倍型频率数据(逗号分隔)
  7. 贡献变异列表(逗号分隔)
  8. 样本:单倍型计数(逗号分隔)

JSON输出

使用--json参数生成JSON格式输出,包含完整单倍型序列:

bash
docker run --rm -v /本地数据目录:/data ensemblorg/ensembl-vep haplo \
  -i /data/phased_input.vcf \
  -o /data/haplo_output.json \
  --cache \
  --json

单倍型标记说明

  • indel:单倍型包含插入或缺失
  • frameshift:移码突变(阅读框改变)
  • resolved_frameshift:多个indel共同恢复阅读框
  • stop_changed:提前终止或终止密码子丢失
  • deleterious_sift_or_polyphen:包含SIFT/PolyPhen预测的有害变异

Variant Recoder

基本用法

bash
# 单个变异转换(HGVS格式)
docker run --rm ensemblorg/ensembl-vep variant_recoder \
  --id "AGT:p.Met259Thr" \
  --pretty

# 批量处理文件(每行一个变异)
docker run --rm -v /本地数据目录:/data ensemblorg/ensembl-vep variant_recoder \
  -i /data/variants.txt \
  --species homo_sapiens \
  --pretty \
  -o /data/recoder_output.json

主要参数

  • --id:单个变异字符串(如变异ID、HGVS)
  • -i/--input_file:变异列表文件(每行一个变异)
  • --species:指定物种(默认:homo_sapiens)
  • --grch37:使用GRCh37参考基因组(默认GRCh38)
  • --pretty:输出格式化JSON
  • --fields:限制输出字段(如id,hgvsg,hgvsc)
  • --vcf_string:输出VCF格式字符串

输出说明

默认输出JSON数组,每个变异对象包含以下字段:

  • input:输入变异字符串
  • id:变异ID列表
  • hgvsg:HGVS基因组命名
  • hgvsc:HGVS转录本命名
  • hgvsp:HGVS蛋白质命名
  • spdi:SPDI格式表示
  • warnings:解析警告信息

示例输出片段:

json
[
  {
    "input": "AGT:p.Met259Thr",
    "id": ["rs699", "CM920010"],
    "hgvsg": ["NC_000001.11:g.230710048A>G"],
    "hgvsc": ["ENST00000366667.6:c.776T>C"],
    "hgvsp": ["ENSP00000355627.5:p.Met259Thr"],
    "spdi": ["NC_000001.11:230710047:A:G"]
  }
]

注意事项

  • 缓存使用:大规模分析建议使用本地缓存(--cache)以提高速度,避免重复下载数据
  • 相位数据:Haplosaurus需相位基因型数据(VCF中用|分隔等位基因)
  • 数据库访问:Variant Recoder需联网访问Ensembl数据库,不支持完全离线模式
  • 资源需求:大型VCF文件分析建议增加容器内存限制(--memory参数)

用户好评

来自真实用户的反馈,见证轩辕镜像的优质服务

oldzhang的头像

oldzhang

运维工程师

Linux服务器

5

"Docker加速体验非常流畅,大镜像也能快速完成下载。"