专属
文档
插件
助手
邀请
顶部
快速返回页面顶部
收起
收起工具栏
轩辕镜像 官方专业版
轩辕镜像
专业版
轩辕镜像 官方专业版
轩辕镜像
专业版
首页个人中心搜索镜像

交易
充值流量我的订单

文档

工具

功能
提交工单页面收录

帮助
轩辕镜像免费版

其他
关于我们网站地图
热门搜索:
pytorch

xingxingzhang/pytorch

xingxingzhang

集成PyTorch深度学习框架、CUDA加速支持及NVIDIA Apex混合精度训练库的Docker镜像,适用于需要GPU加速的深度学习模型开发、训练与推理任务,可简化环境配置并提升训练效率。

下载次数: 0状态:社区镜像维护者:xingxingzhang仓库类型:镜像最近更新:1 年前
让 AI 帮你使用轩辕镜像? · 展开查看说明

如果你使用 DeepSeek、元宝 AI、Copilot、ChatGPT 等 AI 工具,协助配置轩辕镜像、编写 docker pull 命令、修改 Docker Compose 镜像地址、配置镜像加速、排查镜像拉取失败、分析报错日志等问题,请先让 AI 阅读并遵守轩辕镜像的规则文档。

只需在 AI 对话中先发送下面这句话即可:

请先完整阅读并严格遵守以下文档中的全部规则与要求:

https://xuanyuan.cloud/agents.md

在未充分阅读并理解该文档前,不要生成任何命令、配置、修改建议、故障排查方案或技术回答。后续所有输出都必须严格以该文档中的规范为最高优先级执行。

查看 agents.md 用法指南与完整示范。国内用户首推 元宝 AI、DeepSeek 的深度思考模式,不推荐豆包 AI;Cursor 等编辑器可在对话 @ 该链接,或加入 User Rules。 若 AI 无法访问外链,可 打开说明文档 复制全文粘贴。文档会随站点更新,复制内容可能过期,建议定期检查。

轩辕镜像,加速的不只是镜像。点击查看
中文简介
标签下载
镜像标签列表与下载命令
轩辕镜像,加速的不只是镜像。点击查看

PyTorch + CUDA + Apex Docker镜像文档

镜像概述和主要用途

本Docker镜像为深度学习任务提供预配置的运行环境,集成了PyTorch深度学习框架、NVIDIA CUDA工具包及Apex混合精度训练库。通过容器化封装,解决了深度学习环境配置中PyTorch、CUDA、GPU驱动及依赖库版本兼容性问题,支持一键启动GPU加速的深度学习开发、训练与推理流程,适用于学术研究、工业项目开发及教学实验等场景。

核心功能和特性

1. 核心组件集成

  • PyTorch框架:预安装最新稳定版PyTorch,支持主流深度学习模型开发接口(如torch.nn、torch.optim、torch.utils.data等)。
  • CUDA工具包:集成NVIDIA CUDA Toolkit,包含CUDA运行时(CUDA Runtime)、CUDA编译器(nvcc)及GPU加速库(如cuDNN、NCCL),支持GPU计算加速。
  • NVIDIA Apex库:集成NVIDIA Apex混合精度训练工具,提供FP16/FP32混合精度训练、分布式训练优化及模型并行支持,可显著降低显存占用并提升训练速度。

2. 关键特性

  • GPU加速支持:通过CUDA与NVIDIA驱动适配,支持GPU计算密集型任务,提升模型训练/推理效率。
  • 混合精度优化:Apex的amp模块支持自动混合精度训练,在保持模型精度的同时减少显存使用(最高可减少50%)并提升计算速度(最高可提升2倍)。
  • 分布式训练兼容:Apex的distributed模块与PyTorch分布式训练接口无缝集成,支持多GPU/多节点分布式训练配置。
  • 预配置依赖:内置常用深度学习依赖库(如numpy、scipy、pillow、torchvision、torchaudio等),开箱即用。
  • 环境一致性:容器化封装确保不同设备间环境配置一致,避免"本地可运行,部署即报错"的环境依赖问题。

使用场景和适用范围

适用场景

  • 深度学习模型开发:快速搭建PyTorch开发环境,支持模型架构设计、调试与验证。
  • 大规模模型训练:利用Apex混合精度训练和CUDA加速,高效训练大参数量模型(如Transformer、CNN等)。
  • 分布式训练部署:支持多GPU节点的分布式训练任务,适用于需要并行计算资源的场景。
  • 教学与实验环境:为学生或研究人员提供标准化环境,简化深度学习实验配置流程。
  • 推理服务部署:可作为深度学习模型推理服务的基础镜像,支持GPU加速的在线推理。

硬件要求

  • 搭载NVIDIA GPU的主机(需支持CUDA Compute Capability 3.5及以上)。
  • 安装匹配CUDA版本的NVIDIA显卡驱动(驱动版本需≥镜像内置CUDA版本要求,具体版本参考镜像标签说明)。

使用方法和配置说明

前提条件

  • 已安装Docker Engine(推荐版本20.10+)。
  • 已安装nvidia-docker2或nvidia-container-toolkit(用于容器GPU资源调度)。
  • 主机已安装兼容的NVIDIA显卡驱动(驱动版本需满足镜像内置CUDA版本要求)。

基本使用命令

1. 拉取镜像

bash
docker pull [镜像仓库地址]/pytorch-cuda-apex:latest  # 替换为实际镜像仓库地址

2. 启动容器(基础模式)

bash
docker run --gpus all -it --rm [镜像仓库地址]/pytorch-cuda-apex:latest /bin/bash
  • --gpus all:允许容器使用主机所有GPU资源(可指定具体GPU,如--gpus "device=0,1")。
  • -it:交互式终端模式。
  • --rm:容器退出后自动删除。

3. 挂载数据卷(推荐)

挂载本地项目目录至容器,实现数据持久化与文件共享:

bash
docker run --gpus all -it --rm \
  -v /本地项目路径:/workspace \  # 挂载本地项目目录到容器内/workspace
  -w /workspace \  # 设置工作目录为/workspace
  [镜像仓库地址]/pytorch-cuda-apex:latest \
  /bin/bash

4. 运行训练脚本示例

在容器内执行PyTorch训练脚本(假设本地项目目录已挂载至/workspace):

bash
# 在容器终端内执行
python /workspace/train.py --epochs 10 --batch-size 32 --mixed-precision  # 启用混合精度训练

Docker Compose配置示例

创建docker-compose.yml文件,简化多容器或复杂配置管理:

yaml
version: '3.8'
services:
  pytorch-training:
    image: [镜像仓库地址]/pytorch-cuda-apex:latest
    runtime: nvidia  # 或使用deploy.resources.limits.nvidia.com/gpu(取决于Docker版本)
    volumes:
      - /本地项目路径:/workspace
    working_dir: /workspace
    environment:
      - PYTHONPATH=/workspace  # 设置Python路径
      - CUDA_VISIBLE_DEVICES=0,1  # 指定使用GPU 0和1
    command: python train.py --epochs 20 --mixed-precision

启动服务:

bash
docker-compose up

环境变量配置

容器支持通过环境变量自定义运行参数,常用配置如下:

环境变量名说明默认值
PYTHONPATHPython模块搜索路径/usr/local/lib/python3.x/site-packages
CUDA_VISIBLE_DEVICES指定容器可见GPU设备ID(逗号分隔)all
APEX_OPT_LEVELApex混合精度优化级别(O0/O1/O2/O3)O1
LOG_LEVEL日志输出级别(DEBUG/INFO/WARNING/ERROR)INFO

自定义配置

如需扩展镜像功能(如安装额外依赖包),可基于此镜像创建Dockerfile:

dockerfile
FROM [镜像仓库地址]/pytorch-cuda-apex:latest

# 安装额外Python依赖
RUN pip install pandas scikit-learn tensorboard

# 安装系统依赖
RUN apt-get update && apt-get install -y git wget && rm -rf /var/lib/apt/lists/*

# 设置工作目录
WORKDIR /workspace

构建自定义镜像:

bash
docker build -t custom-pytorch-cuda-apex .

注意事项

  1. CUDA版本兼容性:镜像内置CUDA版本需与主机NVIDIA驱动版本匹配(驱动版本需≥CUDA版本要求),具体对应关系参考NVIDIA官方文档。
  2. GPU资源限制:通过--gpus或CUDA_VISIBLE_DEVICES控制GPU使用,避免资源冲突。
  3. Apex使用参考:Apex功能使用方法详见https://github.com/NVIDIA/apex%E3%80%82
  4. 性能优化:对于大模型训练,建议结合Apex混合精度(O1/O2模式)与分布式训练(torch.distributed)以提升效率。

更多相关 Docker 镜像与资源

以下是 xingxingzhang/pytorch 相关的常用 Docker 镜像,适用于 不同场景 等不同场景:

  • pytorch/pytorch Docker 镜像说明
  • rocm/pytorch Docker 镜像说明(PyTorch 机器学习框架,ROCm GPU 加速版本)
  • bitnamicharts/pytorch Docker 镜像说明(Bitnami PyTorch 图表栈,适合深度学习训练与推理)
  • nvidia/cuda Docker 镜像说明
  • dustynv/vllm Docker 镜像说明(高性能 LLM 推理服务)

镜像拉取方式

您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 标签列表页面。

轩辕镜像加速拉取命令点我查看更多 pytorch 镜像标签

docker pull docker.xuanyuan.run/xingxingzhang/pytorch:<标签>

使用方法:

  • 登录认证方式
  • 免认证方式

DockerHub 原生拉取命令

docker pull xingxingzhang/pytorch:<标签>

更多 pytorch 镜像推荐

pytorch/pytorch logo

pytorch/pytorch

pytorch
PyTorch是一款以Python为首要设计理念的深度学习框架,凭借简洁易用的Python接口、动态计算图机制及强大的灵活性,广泛应用于学术研究与工业开发,支持从快速原型设计到大规模部署的全流程,深度融合Python数据科学生态,为开发者提供高效且直观的深度学习解决方案。
1.6千 次收藏1000万+ 次下载
1 个月前更新
rocm/pytorch logo

rocm/pytorch

rocm
基于ROCm的PyTorch Docker镜像为开发者提供了预配置的深度学习环境,集成了PyTorch框架与AMD ROCm开源计算平台,支持AMD GPU硬件加速,无需手动配置驱动及库依赖,可直接用于深度学习模型的开发、训练与部署,有效简化环境搭建流程,确保跨平台一致性,适用于科研机构、工业界等多种场景,助力高效利用AMD硬件资源开展AI相关任务。
123 次收藏100万+ 次下载
16 天前更新
bitnamicharts/pytorch logo

bitnamicharts/pytorch

bitnamicharts
Bitnami提供的PyTorch Helm chart,用于在Kubernetes环境中简化PyTorch的部署与管理。
50万+ 次下载
8 天前更新
openeuler/pytorch logo

openeuler/pytorch

openeuler
基于openEuler构建的PyTorch官方Docker镜像,提供张量计算(支持GPU加速)和基于自动微分系统的深度神经网络功能,适用于深度学习开发与研究。
1 次收藏313 次下载
2 年前更新
pytorch/almalinux-builder logo

pytorch/almalinux-builder

pytorch
已安装conda的通用目的镜像,用于PyTorch的CI/CD流程。
100万+ 次下载
5 天前更新
pytorch/manylinux2_28-builder logo

pytorch/manylinux2_28-builder

pytorch
暂无描述
1 次收藏100万+ 次下载
5 天前更新

查看更多 pytorch 相关镜像

轩辕镜像配置手册

按平台快速找到配置文档

Docker

登录仓库拉取

登录认证 · 私有仓库

专属域名拉取

免登录 · 高速拉取

Linux

Docker 镜像配置

Windows / Mac

Docker Desktop 配置

MacOS OrbStack

OrbStack 容器

Docker Compose

Compose 项目配置

NAS

群晖

Synology 配置

飞牛

fnOS 镜像配置

绿联

绿联 NAS

威联通

QNAP 配置

极空间

极空间 NAS

企业仓库

其他仓库

ghcr · Quay · nvcr

Harbor 镜像源

Proxy Repository 对接

Portainer 镜像源

Registries 配置

Nexus 镜像源

Docker Proxy 缓存

开发工具

Dev Containers

VS Code 开发容器

Podman

Podman 配置指南

Singularity / Apptainer

HPC 科学计算容器

Kubernetes

K8s Containerd

Kubernetes · Containerd

K3s

轻量级集群

面板 / 网络

爱快路由

iKuai 镜像加速

宝塔面板

一键配置镜像源

AI

用 AI 使用轩辕镜像

agents.md · AI 对话 · 提示词

一键安装

一键安装 Docker

Linux Docker 一键安装

需要其他帮助?请查看我们的 常见问题 Docker 镜像访问常见问题解答 或 提交工单

镜像拉取常见问题

功能

免费版与专业版区别

功能对比 · 版本选择

支持的镜像仓库

Docker Hub · GCR · GHCR

新手拉取配置

登录 · 专属域名 · 配置

docker search 限制

专属域名 · Hub 搜索

不支持 push

仅支持 pull · 不支持

拉取速度原因

带宽 · 缓存 · 冷热镜像

错误码

402 与流量用尽

402 · 流量包 · 充值

401 认证失败

401 · docker login

manifest unknown

标签错误 · 镜像不存在

410 Gone 排查

410 · Docker 升级

429 限流

免费版 · 请求频率

其他报错

DNS 超时

DNS 解析 · 网络超时

TLS 证书失败

no matching manifest(架构)

账号

失败是否计费

manifest · blob · 计费

申请开发票(企业 / 个人)

企业 · 个人 · 工单

修改登录密码

网站 · 仓库 · 重置

注销账户

工单 · 数据 · 注销

原理

mirrors 不生效

daemon.json · 重启

去掉域名前缀

docker tag · 重命名

指定架构拉取

ARM64 · AMD64 · 多架构

latest 与「最新」

digest · 版本号 · 标签

查看全部问题→

用户好评

来自真实用户的反馈,见证轩辕镜像的优质服务

用户头像

oldzhang

运维工程师

Linux服务器

5

"Docker访问体验非常流畅,大镜像也能快速完成下载。"

轩辕镜像
镜像详情
...
xingxingzhang/pytorch
教程轩辕镜像功能与使用教程
价格查看流量套餐与价格
热门查看热门 Docker 镜像推荐
博客Docker 镜像公告与技术博客
官方公众号:源码跳动|官方技术交流群:51517718
官方公众号:源码跳动|官方技术交流群:|问题咨询请:提交工单
商务合作:点击复制邮箱
©2024-2026 源码跳动
商务合作:点击复制邮箱Copyright © 2024-2026 杭州源码跳动科技有限公司. All rights reserved.