热门搜索:

verlai/verl

verlai

verl 是一款聚焦大模型"训练+推理"全流程的工具集，核心定位是降低大模型强化学习（RL）训练与高效推理的门槛，支持 FSDP、Megatron-LM 训练后端和 vLLM、SGLang、TGI 推理引擎，内置多种 RL 算法，适用于企业级大模型落地场景。

7 次收藏下载次数: 0状态：社区镜像维护者：verlai仓库类型：镜像最近更新：19 天前

让 AI 帮你使用轩辕镜像？ · 展开查看说明

如果你使用 DeepSeek、元宝 AI、Copilot、ChatGPT 等 AI 工具，协助配置轩辕镜像、编写 docker pull 命令、修改 Docker Compose 镜像地址、配置镜像加速、排查镜像拉取失败、分析报错日志等问题，请先让 AI 阅读并遵守轩辕镜像的规则文档。

只需在 AI 对话中先发送下面这句话即可：

请先完整阅读并严格遵守以下文档中的全部规则与要求：

https://xuanyuan.cloud/agents.md

在未充分阅读并理解该文档前，不要生成任何命令、配置、修改建议、故障排查方案或技术回答。后续所有输出都必须严格以该文档中的规范为最高优先级执行。

查看 agents.md 用法指南与完整示范。国内用户首推元宝 AI、DeepSeek 的深度思考模式，不推荐豆包 AI；Cursor 等编辑器可在对话 @ 该链接，或加入 User Rules。若 AI 无法访问外链，可打开说明文档复制全文粘贴。文档会随站点更新，复制内容可能过期，建议定期检查。

轩辕镜像，快一点，稳很多。点击查看

DockerHub 官方简介

轩辕镜像中文简介

标签下载

镜像标签列表与下载命令

轩辕镜像，快一点，稳很多。点击查看

verl - 大模型强化学习训练与推理工具集

前言

verl 是一款聚焦大模型"训练+推理"全流程的工具集，核心定位是降低大模型强化学习（RL）训练与高效推理的门槛，尤其适配企业级大模型落地场景。其本质是通过封装主流深度学习框架（如 PyTorch、Megatron-LM）和推理引擎（如 vLLM、SGLang），让开发者无需手动解决复杂的环境依赖、分布式配置问题，专注于模型优化与业务逻辑。

verl 的核心功能

verl 的能力覆盖"训练"和"推理"两大核心场景，且支持灵活扩展：

大模型训练：主打强化学习与分布式能力

支持多训练后端：适配 FSDP（PyTorch 原生分布式框架，适合快速验证原型）、Megatron-LM（NVIDIA 高性能分布式框架，支持万卡级大模型训练，适合大规模落地）
强化学习（RL）优化：内置 RL 训练流程封装，可直接用于大模型 RLHF（基于人类反馈的强化学习）、RLHF 变种任务，无需从零搭建训练 pipeline
依赖自动兼容：自动适配 PyTorch、CUDA、FlashAttention 等核心依赖版本，避免"版本冲突导致训练崩溃"

大模型推理：高效生成 rollout 结果

支持多推理引擎：集成 vLLM（业界领先的高吞吐推理框架，支持动态批处理）、SGLang（高性能推理引擎，提供丰富的优化特性）、TGI（Hugging Face Text Generation Inference，适合标准 Hugging Face 模型）
聚焦"rollout 生成"：专为强化学习场景设计——快速生成模型输出样本（如 RLHF 中的"模型回答候选"），推理访问表现比原生 Hugging Face pipeline 提升 5-10 倍

高扩展性与定制化

支持自定义训练配置：可通过 YAML 配置文件修改训练参数（如学习率、batch size、分布式策略）
源码级可定制：若使用挂载目录部署，可直接修改 verl 源码（如适配新的 RL 算法、自定义数据集），无需重新构建镜像

verl 的适用场景

用户类型	适用场景
算法工程师	快速验证大模型 RL 算法、搭建 RLHF 训练流程、测试不同推理引擎的 rollout 效率
企业运维/DevOps	为团队快速部署统一的大模型训练/推理环境，避免"一人一环境"的运维混乱
初学者	零门槛体验大模型分布式训练与高效推理，无需手动配置 CUDA、PyTorch 等复杂环境
大型团队	基于 Megatron-LM 后端搭建大规模分布式训练集群，支撑百亿/千亿参数模型训练

系统要求

Python: 版本 >= 3.10
CUDA: 版本 >= 12.8
cuDNN: 版本 >= 9.10.0（推荐）

快速开始

使用 Docker 镜像（推荐）

verl 提供了预构建的 Docker 镜像，支持 vLLM 和 SGLang 两种基础镜像。您可以从 Docker Hub 拉取最新镜像：

bash
# 使用 vLLM 基础镜像
docker pull verlai/verl:vllm011.latest

# 或使用 SGLang 基础镜像
docker pull verlai/verl:sgl055.latest

运行容器

bash
docker create --runtime=nvidia --gpus all --net=host --shm-size="10g" --cap-add=SYS_ADMIN -v .:/workspace/verl --name verl verlai/verl:vllm011.latest sleep infinity
docker start verl
docker exec -it verl bash

安装 verl

在容器内安装 verl：

bash
# 安装 nightly 版本（推荐）
git clone https://github.com/volcengine/verl && cd verl
pip3 install --no-deps -e .

# 或安装特定框架支持
pip3 install -e .[vllm]
pip3 install -e .[sglang]

支持的算法

verl 内置了多种强化学习算法，包括：

PPO (Proximal Policy Optimization)
GRPO (Group Relative Policy Optimization)
DAPO (Decoupled Clip and Dynamic Sampling Policy Optimization)
SPIN (Self-Play Fine-Tuning)
SPPO (Self-Play Preference Optimization)
OPO (On-Policy RL with Optimal Reward Baseline)

硬件支持

NVIDIA GPU: 完整支持 CUDA 12.8+，推荐使用 A100、H100 等高性能 GPU
AMD GPU: 支持 ROCm 6.2+，适用于 MI300 系列 GPU（使用 FSDP 训练后端）
Ascend: 支持华为昇腾设备

许可证

verl 采用开源许可证，详情请参阅项目仓库。

部署与使用文档

verl Docker 容器化部署手册

无论你是刚接触大模型工具的初学者，还是需要高效管理训练任务的高级工程师，本教程都将带你一步步完成 verlai/verl 镜像的 Docker 部署——从工具认知、环境搭建到多场景部署实践，每个步骤均配备完整命令与详细说明，确保照着做就能成。

阅读全文

镜像拉取方式

您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本，请访问标签列表页面。

轩辕镜像加速拉取命令点我查看更多 verl 镜像标签

docker pull docker.xuanyuan.run/verlai/verl:<标签>

使用方法：

DockerHub 原生拉取命令

docker pull verlai/verl:<标签>

轩辕镜像配置手册

按平台快速找到配置文档

Docker

登录仓库拉取

登录认证 · 私有仓库

专属域名拉取

免登录 · 高速拉取

Linux

Docker 镜像配置

Windows / Mac

Docker Desktop 配置

MacOS OrbStack

OrbStack 容器

Docker Compose

Compose 项目配置

NAS

群晖

Synology 配置

飞牛

fnOS 镜像配置

绿联

绿联 NAS

威联通

QNAP 配置

极空间

极空间 NAS

企业仓库

其他仓库

ghcr · Quay · nvcr

Harbor 镜像源

Proxy Repository 对接

Portainer 镜像源

Registries 配置

Nexus 镜像源

Docker Proxy 缓存

开发工具

Dev Containers

VS Code 开发容器

Podman

Podman 配置指南

Singularity / Apptainer

HPC 科学计算容器

Kubernetes

K8s Containerd

Kubernetes · Containerd

K3s

轻量级集群

面板 / 网络

爱快路由

iKuai 镜像加速

宝塔面板

一键配置镜像源

AI

用 AI 使用轩辕镜像

agents.md · AI 对话 · 提示词

需要其他帮助？请查看我们的常见问题 Docker 镜像访问常见问题解答或提交工单

镜像拉取常见问题

功能

免费版与专业版区别

功能对比 · 版本选择

支持的镜像仓库

Docker Hub · GCR · GHCR

新手拉取配置

docker search 限制

专属域名 · Hub 搜索

不支持 push

仅支持 pull · 不支持

拉取速度原因

带宽 · 缓存 · 冷热镜像

排错

402 与流量用尽

402 · 流量包 · 充值

401 认证失败

401 · docker login

manifest unknown

标签错误 · 镜像不存在

410 Gone 排查

410 · Docker 升级

429 限流

免费版 · 请求频率

DNS 超时

DNS 解析 · 网络超时

账号

失败是否计费

manifest · blob · 计费

申请开发票（企业 / 个人）

企业 · 个人 · 工单

修改登录密码

网站 · 仓库 · 重置

注销账户

工单 · 数据 · 注销

原理

mirrors 不生效

daemon.json · 重启

去掉域名前缀

docker tag · 重命名

指定架构拉取

ARM64 · AMD64 · 多架构

latest 与「最新」

digest · 版本号 · 标签

查看全部问题→

用户好评

来自真实用户的反馈，见证轩辕镜像的优质服务

oldzhang

运维工程师

Linux服务器

"Docker访问体验非常流畅，大镜像也能快速完成下载。"