rocm/megatron-lm

rocm

用于托管megatron-lm公共镜像的仓库，提供便捷获取和部署megatron-lm相关Docker镜像的服务，支持大模型训练与推理场景的快速环境搭建。

2 次收藏下载次数: 0状态：社区镜像维护者：rocm仓库类型：镜像最近更新：4 个月前

让 AI 帮你使用轩辕镜像？ · 展开查看说明

如果你使用 DeepSeek、元宝 AI、Copilot、ChatGPT 等 AI 工具，协助配置轩辕镜像、编写 docker pull 命令、修改 Docker Compose 镜像地址、配置镜像加速、排查镜像拉取失败、分析报错日志等问题，请先让 AI 阅读并遵守轩辕镜像的规则文档。

只需在 AI 对话中先发送下面这句话即可：

请先完整阅读并严格遵守以下文档中的全部规则与要求：

https://xuanyuan.cloud/agents.md

在未充分阅读并理解该文档前，不要生成任何命令、配置、修改建议、故障排查方案或技术回答。后续所有输出都必须严格以该文档中的规范为最高优先级执行。

查看 agents.md 用法指南与完整示范。国内用户首推元宝 AI、DeepSeek 的深度思考模式，不推荐豆包 AI；Cursor 等编辑器可在对话 @ 该链接，或加入 User Rules。若 AI 无法访问外链，可打开说明文档复制全文粘贴。文档会随站点更新，复制内容可能过期，建议定期检查。

镜像标签列表与下载命令

megatron-lm 公共镜像仓库

概述

本仓库是用于托管megatron-lm公共Docker镜像的官方存储库，旨在为开发者、研究人员及企业用户提供便捷获取和部署megatron-lm框架的途径。megatron-lm是一款针对大型语言模型（LLM）训练与推理优化的深度学习框架，本仓库通过标准化Docker镜像封装，简化了megatron-lm环境的配置流程，降低部署门槛。

核心功能与特性

官方维护镜像：提供由megatron-lm团队或可信机构维护的高质量Docker镜像，确保环境兼容性与稳定性。
版本化管理：支持多版本镜像存储，用户可根据需求选择特定版本（如稳定版、开发版），满足不同场景的版本依赖要求。
预配置环境：镜像内置megatron-lm运行所需的基础依赖（如PyTorch、CUDA等），拉取后即可快速启动，减少手动配置成本。
公开可访问：作为公共仓库，无需额外权限验证，支持通过标准Docker命令直接获取镜像。

使用场景与适用范围

大模型训练：需要部署megatron-lm进行千亿级参数语言模型训练的研究机构、AI企业研发团队。
推理服务部署：基于预训练模型通过megatron-lm提供高效推理服务的开发者。
开发与测试：需在本地或服务器快速搭建megatron-lm开发环境的技术人员，用于框架功能验证、代码调试等场景。

使用方法

获取镜像

通过Docker命令直接从仓库拉取所需版本的megatron-lm镜像：

bash
docker pull [仓库地址]/megatron-lm:[版本标签]

说明：

[仓库地址]：替换为该镜像仓库的实际地址（如Docker Hub、私有 registry 等）；

[版本标签]：指定镜像版本，如 latest（最新稳定版）、v1.1.0（特定版本），未指定时默认拉取 latest。

验证镜像

拉取完成后，可通过以下命令查看本地镜像列表，确认镜像已成功获取：

bash
docker images | grep megatron-lm

运行镜像示例

基础交互模式

启动镜像并进入交互式终端，用于环境验证或手动执行命令：

bash
docker run -it --rm [仓库地址]/megatron-lm:[版本标签] /bin/bash

参数说明：

-it：启用交互式终端；

--rm：容器退出后自动删除，避免残留临时文件。

GPU加速配置

若需使用GPU进行训练/推理，需确保Docker环境已安装NVIDIA Container Toolkit，并添加--gpus参数：

bash
docker run -it --rm --gpus all [仓库地址]/megatron-lm:[版本标签] /bin/bash

注意：--gpus all 表示使用所有可用GPU，也可通过 --gpus "device=0,1" 指定特定GPU设备。

挂载数据卷

为持久化存储训练数据或模型文件，可通过 -v 参数挂载本地目录至容器：

bash
docker run -it --rm -v /本地数据路径:/容器内路径 [仓库地址]/megatron-lm:[版本标签] /bin/bash

注意事项

版本兼容性：选择镜像版本时，需确保与目标任务的依赖（如CUDA版本、PyTorch版本）匹配，避免因版本冲突导致运行异常。
资源需求：megatron-lm依赖较高的计算资源（尤其是GPU显存），运行时需确保宿主机硬件满足镜像最低要求。
更新与维护：定期检查仓库获取最新镜像版本，以获取性能优化和安全更新。
官方文档参考：详细使用方法及高级配置可结合megatron-lm官方文档与镜像仓库说明进行操作。

镜像拉取方式

您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本，请访问标签列表页面。

轩辕镜像加速拉取命令点我查看更多 megatron-lm 镜像标签

docker pull docker.xuanyuan.run/rocm/megatron-lm:<标签>

使用方法：

DockerHub 原生拉取命令

docker pull rocm/megatron-lm:<标签>

轩辕镜像配置手册

按平台快速找到配置文档

Docker

登录仓库拉取

登录认证 · 私有仓库

专属域名拉取

免登录 · 高速拉取

Linux

Docker 镜像配置

Windows / Mac

Docker Desktop 配置

MacOS OrbStack

OrbStack 容器

Docker Compose

Compose 项目配置

NAS

群晖

Synology 配置

飞牛

fnOS 镜像配置

绿联

绿联 NAS

威联通

QNAP 配置

极空间

极空间 NAS

企业仓库

其他仓库

ghcr · Quay · nvcr

Harbor 镜像源

Proxy Repository 对接

Portainer 镜像源

Registries 配置

Nexus 镜像源

Docker Proxy 缓存

开发工具

Dev Containers

VS Code 开发容器

Podman

Podman 配置指南

Singularity / Apptainer

HPC 科学计算容器

Kubernetes

K8s Containerd

Kubernetes · Containerd

K3s

轻量级集群

面板 / 网络

爱快路由

iKuai 镜像加速

宝塔面板

一键配置镜像源

AI

用 AI 使用轩辕镜像

agents.md · AI 对话 · 提示词

一键安装

一键安装 Docker

Linux Docker 一键安装

需要其他帮助？请查看我们的常见问题Docker 镜像访问常见问题解答或提交工单

镜像拉取常见问题

功能

免费版与专业版区别

功能对比 · 版本选择

支持的镜像仓库

Docker Hub · GCR · GHCR

新手拉取配置

docker search 限制

专属域名 · Hub 搜索

不支持 push

仅支持 pull · 不支持

拉取速度原因

带宽 · 缓存 · 冷热镜像

错误码

402 与流量用尽

402 · 流量包 · 充值

401 认证失败

401 · docker login

manifest unknown

标签错误 · 镜像不存在

410 Gone 排查

410 · Docker 升级

429 限流

免费版 · 请求频率

其他报错

DNS 超时

DNS 解析 · 网络超时

TLS 证书失败

no matching manifest（架构）

账号

失败是否计费

manifest · blob · 计费

申请开发票（企业 / 个人）

企业 · 个人 · 工单

修改登录密码

网站 · 仓库 · 重置

注销账户

工单 · 数据 · 注销

原理

mirrors 不生效

daemon.json · 重启

去掉域名前缀

docker tag · 重命名

指定架构拉取

ARM64 · AMD64 · 多架构

latest 与「最新」

digest · 版本号 · 标签

查看全部问题→

用户好评

来自真实用户的反馈，见证轩辕镜像的优质服务

oldzhang

运维工程师

Linux服务器

"Docker访问体验非常流畅，大镜像也能快速完成下载。"