rocm/7.0-preview注意: 本文档配套限量预览容器镜像,旨在验证和复现AMD MI355X 与 MI350X 加速器的推理及训练性能,这些加速器在2025年6月12日AMD“Advancing AI”活动中发布。该镜像提供ROCm 7.0软件栈的预发布版本,面向早期访问用户,用于评估下一代AMD GPU硬件上的推理和训练工作负载。本预览版的目标是提供使用代表性大规模语言和推理模型的实际基准测试能力,具备优化的计算精度和配置。
使用该镜像前需确保系统已安装Docker及ROCm驱动。基础部署命令示例:
docker run --device=/dev/kfd --device=/dev/dri --group-add video -v /path/to/data:/data -it <镜像名称>
具体参数及详细部署步骤请参考各基准测试指南中的说明。
使用vLLM基准测试Llama 3.1 405B FP4推理
使用vLLM基准测试Llama 3.3 70B FP8推理
使用vLLM基准测试GPT OSS 120B推理
使用SGLang基准测试DeepSeek R1 FP4推理
使用SGLang基准测试DeepSeek R1 FP8推理
使用MLPerf基准测试Llama 2 70B LoRA微调
使用Megatron-LM基准测试Llama 3预训练
使用torchtitan基准测试Llama 3预训练

manifest unknown 错误
TLS 证书验证失败
DNS 解析超时
410 错误:版本过低
402 错误:流量耗尽
身份认证失败错误
429 限流错误
凭证保存错误
来自真实用户的反馈,见证轩辕镜像的优质服务