该镜像是由NERSC(美国国家能源研究科学计算中心)基于NVIDIA官方PyTorch容器构建的GPU优化镜像。它继承了NVIDIA PyTorch容器的核心特性,专为GPU计算环境定制,旨在提供稳定、高效的GPU加速PyTorch运行环境。主要用途包括支持深度学习模型的开发、训练、推理等任务,满足科研和工业界对高性能PyTorch-GPU计算的需求。
适用场景
适用范围
4.1 基本使用(docker run命令)
需确保主机已安装Docker及nvidia-docker运行时,以启用GPU支持。基本启动命令如下:
bashdocker run --gpus all -it --rm -v $(pwd):/workspace nersc/gpu-pytorch-image:latest /bin/bash
--gpus all:启用所有可用GPU设备(也可指定具体设备,如--gpus "device=0,1")。-it:以交互式终端模式运行。--rm:容器退出后自动删除。-v $(pwd):/workspace:将主机当前目录挂载到容器内/workspace目录,用于数据和代码共享。nersc/gpu-pytorch-image:latest:镜像名称及标签(实际使用时需替换为具体版本标签)。/bin/bash:启动容器后执行的命令(进入bash终端)。4.2 环境变量配置
可通过-e参数设置环境变量,调整容器运行配置:
CUDA_VISIBLE_DEVICES:指定容器可见的GPU设备ID(如-e CUDA_VISIBLE_DEVICES=0仅启用第0号GPU)。PYTORCH_CUDA_ALLOC_CONF:PyTorch CUDA内存分配配置(如max_split_size_mb:128控制内存分配粒度)。LOG_LEVEL:日志级别(如INFO、DEBUG,具体支持值需参考镜像内置配置)。示例(指定单个GPU及内存配置):
bashdocker run --gpus "device=0" -it -e CUDA_VISIBLE_DEVICES=0 -e PYTORCH_CUDA_ALLOC_CONF="max_split_size_mb:128" -v $(pwd):/workspace nersc/gpu-pytorch-image:latest /bin/bash
4.3 持久化存储与数据共享
通过-v参数挂载主机目录或存储卷,实现数据持久化和代码共享:
-v /host/data:/container/data(将主机/host/data目录挂载到容器/container/data)。-v /host/code:/container/code(方便在容器内运行主机代码)。4.4 验证GPU可用性
容器启动后,可通过以下命令验证PyTorch是否成功调用GPU:
pythonimport torch print(torch.cuda.is_available()) # 输出True表示GPU可用 print(torch.cuda.get_device_name(0)) # 输出GPU设备名称
以下是 nersc/pytorch 相关的常用 Docker 镜像,适用于 不同场景 等不同场景:
您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 标签列表页面。
探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式
通过 Docker 登录认证访问私有仓库
无需登录使用专属域名
Kubernetes 集群配置 Containerd
K3s 轻量级 Kubernetes 镜像加速
VS Code Dev Containers 配置
Podman 容器引擎配置
HPC 科学计算容器配置
ghcr、Quay、nvcr 等镜像仓库
Harbor Proxy Repository 对接专属域名
Portainer Registries 加速拉取
Nexus3 Docker Proxy 内网缓存
需要其他帮助?请查看我们的 常见问题Docker 镜像访问常见问题解答 或 提交工单
docker search 限制
站内搜不到镜像
离线 save/load
插件要用 plugin install
WSL 拉取慢
安全与 digest
新手拉取配置
镜像合规机制
manifest unknown
no matching manifest(架构)
invalid tar header(解压)
TLS 证书失败
DNS 超时
域名连通性排查
410 Gone 排查
402 与流量用尽
401 认证失败
429 限流
D-Bus 凭证提示
413 与超大单层
来自真实用户的反馈,见证轩辕镜像的优质服务