如果你使用 DeepSeek、元宝 AI、Copilot、ChatGPT 等 AI 工具,协助配置轩辕镜像、编写 docker pull 命令、修改 Docker Compose 镜像地址、配置镜像加速、排查镜像拉取失败、分析报错日志等问题,请先让 AI 阅读并遵守轩辕镜像的规则文档。
只需在 AI 对话中先发送下面这句话即可:
请先完整阅读并严格遵守以下文档中的全部规则与要求:
https://xuanyuan.cloud/agents.md
在未充分阅读并理解该文档前,不要生成任何命令、配置、修改建议、故障排查方案或技术回答。后续所有输出都必须严格以该文档中的规范为最高优先级执行。查看 agents.md 用法指南与完整示范。国内用户首推 元宝 AI、DeepSeek 的深度思考模式,不推荐豆包 AI;Cursor 等编辑器可在对话 @ 该链接,或加入 User Rules。 若 AI 无法访问外链,可 打开说明文档 复制全文粘贴。文档会随站点更新,复制内容可能过期,建议定期检查。
NCBI Datasets镜像是基于NCBI(美国国家生物技术信息中心)官方工具的Docker封装,旨在为生物信息学研究人员、开发者提供便捷的跨NCBI数据库数据收集能力。该镜像集成了NCBI Datasets命令行工具,支持从GenBank、RefSeq、SRA、PubMed等NCBI核心数据库中快速获取标准化的生物数据,简化数据获取流程,提升科研效率。
1. 拉取镜像
bashdocker pull ncbi/datasets:latest
可通过指定标签使用特定版本,如
ncbi/datasets:16.24
2. 查看工具帮助信息
bashdocker run --rm ncbi/datasets datasets --help
3. 下载示例数据(以人类参考基因组为例)
bash# 创建本地目录存储数据 mkdir -p ./ncbi_data # 下载人类(taxon ID: 9606)参考基因组数据 docker run --rm -v $(pwd)/ncbi_data:/data ncbi/datasets \ datasets download genome taxon 9606 \ --reference \ --output /data/human_genome.zip
参数说明:
--rm:容器退出后自动删除-v $(pwd)/ncbi_data:/data:挂载本地目录./ncbi_data到容器内/data路径,用于数据持久化genome taxon 9606:指定下载分类单元ID为9606(人类)的基因组数据--reference:仅下载参考基因组--output:指定输出文件路径
下载特定基因的蛋白质序列
bashdocker run --rm -v $(pwd)/ncbi_data:/data ncbi/datasets \ datasets download gene gene-id 1017 \ --include protein \ --output /data/gene_1017_protein.zip
gene-id 1017对应人类TP53基因
批量下载SRA实验数据
bashdocker run --rm -v $(pwd)/ncbi_data:/data ncbi/datasets \ datasets download sra accession SRR1234567 SRR1234568 \ --output /data/sra_data.zip
环境变量(可选)
NCBI_API_KEY:若需提高NCBI API调用频率限制,可设置该变量(需从NCBI账户获取)
bashdocker run --rm -e NCBI_API_KEY="your_api_key" ncbi/datasets ...
数据挂载建议
为避免重复下载和数据丢失,建议始终通过-v参数挂载本地目录至容器内固定路径(如/data),示例:
bash-v /path/to/local/data:/data
--delay参数设置请求间隔(单位:秒)latest您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 标签列表页面。
来自真实用户的反馈,见证轩辕镜像的优质服务