verl 是一款聚焦大模型"训练+推理"全流程的工具集,核心定位是降低大模型强化学习(RL)训练与高效推理的门槛,支持 FSDP、Megatron-LM 训练后端和 vLLM、SGLang、TGI 推理引擎,内置多种 RL 算法,适用于企业级大模型落地场景。
收藏数: 5
下载次数: 585266
类型:

verlai/verlverl 是一款聚焦大模型"训练+推理"全流程的工具集,核心定位是降低大模型强化学习(RL)训练与高效推理的门槛,尤其适配企业级大模型落地场景。其本质是通过封装主流深度学习框架(如 PyTorch、Megatron-LM)和推理引擎(如 vLLM、SGLang),让开发者无需手动解决复杂的环境依赖、分布式配置问题,专注于模型优化与业务逻辑。
verl 的能力覆盖"训练"和"推理"两大核心场景,且支持灵活扩展:
| 用户类型 | 适用场景 |
|---|---|
| 算法工程师 | 快速验证大模型 RL 算法、搭建 RLHF 训练流程、测试不同推理引擎的 rollout 效率 |
| 企业运维/DevOps | 为团队快速部署统一的大模型训练/推理环境,避免"一人一环境"的运维混乱 |
| 初学者 | 零门槛体验大模型分布式训练与高效推理,无需手动配置 CUDA、PyTorch 等复杂环境 |
| 大型团队 | 基于 Megatron-LM 后端搭建大规模分布式训练集群,支撑百亿/千亿参数模型训练 |
verl 提供了预构建的 Docker 镜像,支持 vLLM 和 SGLang 两种基础镜像。您可以从 Docker Hub 拉取最新镜像:
bash# 使用 vLLM 基础镜像 docker pull verlai/verl:vllm011.latest # 或使用 SGLang 基础镜像 docker pull verlai/verl:sgl055.latest
bashdocker create --runtime=nvidia --gpus all --net=host --shm-size="10g" --cap-add=SYS_ADMIN -v .:/workspace/verl --name verl verlai/verl:vllm011.latest sleep infinity docker start verl docker exec -it verl bash
在容器内安装 verl:
bash# 安装 nightly 版本(推荐) git clone [***] && cd verl pip3 install --no-deps -e . # 或安装特定框架支持 pip3 install -e .[vllm] pip3 install -e .[sglang]
verl 内置了多种强化学习算法,包括:
verl 采用开源许可证,详情请参阅项目仓库。
以下是 verlai/verl 相关的常用 Docker 镜像,适用于 不同场景 等不同场景:
您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 版本下载页面。


manifest unknown 错误
TLS 证书验证失败
DNS 解析超时
410 错误:版本过低
402 错误:流量耗尽
身份认证失败错误
429 限流错误
凭证保存错误
来自真实用户的反馈,见证轩辕镜像的优质服务