rocm/pytorch-nightly本Docker镜像包含最新ROCm(AMD Radeon Open Compute)版本与PyTorch主分支(pytorch/pytorch main branch)尖端代码,通过每日夜间构建(nightly basis)生成。
主要用途:提供PyTorch最新开发版本的运行环境,适用于开发、测试PyTorch新特性,或在AMD GPU上基于最新ROCm和PyTorch代码进行原型验证。
nvidia-container-toolkit类似工具,或ROCm专用容器运行时)。假设镜像托管于Docker仓库(如Docker Hub或私有仓库),拉取命令如下(请替换<repo>为实际仓库名称):
bashdocker pull <repo>/pytorch-nightly-rocm:latest
注:
latest标签对应每日夜间构建的最新版本,也可指定具体日期标签(如20240520)获取历史版本。
bashdocker run -it --rm \ --device /dev/kfd \ --device /dev/dri \ --group-add video \ --cap-add=SYS_PTRACE \ --security-opt seccomp=unconfined \ <repo>/pytorch-nightly-rocm:latest \ bash
参数说明:
--device /dev/kfd --device /dev/dri:挂载ROCm所需的设备文件(AMD GPU访问)。--group-add video:添加video用户组,确保容器内访问GPU设备权限。--cap-add=SYS_PTRACE --security-opt seccomp=unconfined:提供必要的系统调用权限,避免ROCm运行时受限。挂载本地代码目录至容器内,方便实时开发:
bashdocker run -it --rm \ --device /dev/kfd --device /dev/dri \ --group-add video \ -v /path/to/local/code:/workspace \ -w /workspace \ <repo>/pytorch-nightly-rocm:latest \ bash
-v /path/to/local/code:/workspace:将本地代码目录挂载到容器内/workspace。-w /workspace:设置工作目录为/workspace。创建docker-compose.yml文件,定义容器服务:
yamlversion: '3.8' services: pytorch-nightly: image: <repo>/pytorch-nightly-rocm:latest devices: - /dev/kfd:/dev/kfd - /dev/dri:/dev/dri group_add: - video cap_add: - SYS_PTRACE security_opt: - seccomp:unconfined volumes: - ./local_code:/workspace working_dir: /workspace tty: true stdin_open: true
启动服务:
bashdocker-compose up -d
进入容器:
bashdocker-compose exec pytorch-nightly bash
镜像支持通过环境变量调整PyTorch及ROCm运行时行为,常见配置如下:
| 环境变量名 | 说明 | 示例值 |
|---|---|---|
HIP_VISIBLE_DEVICES | 指定容器内可见的AMD GPU设备ID | 0,1(仅使用第0、1块GPU) |
PYTORCH_LOG_LEVEL | 设置PyTorch日志级别(DEBUG/INFO/WARN) | INFO |
PYTORCH_CUDA_ALLOC_CONF | PyTorch内存分配配置(如max_split_size_mb:128) | max_split_size_mb:128 |
运行容器时指定环境变量:
bashdocker run -it --rm \ --device /dev/kfd --device /dev/dri \ --group-add video \ -e HIP_VISIBLE_DEVICES=0 \ -e PYTORCH_LOG_LEVEL=DEBUG \ <repo>/pytorch-nightly-rocm:latest \ bash
manifest unknown 错误
TLS 证书验证失败
DNS 解析超时
410 错误:版本过低
402 错误:流量耗尽
身份认证失败错误
429 限流错误
凭证保存错误
来自真实用户的反馈,见证轩辕镜像的优质服务