bitnamicharts/pytorchPyTorch 是一个深度学习平台,可加速从研究原型到生产部署的过渡。Bitnami 提供的 PyTorch 镜像包含 Torchvision,专为特定计算机视觉任务提供支持。该镜像由 Bitnami 打包,旨在简化 PyTorch 在容器化环境中的部署和使用。
PyTorch 官方概述
商标说明:本软件列表由 Bitnami 打包。所提及的相关商标归各自公司所有,使用这些商标并不意味着任何关联或背书。
worldSize 参数支持多节点分布式训练。自 2025 年 8 月 28 日起,Bitnami 将升级其公共镜像目录,推出Bitnami Secure Images 计划,提供经过安全强化的精选镜像。过渡期间的关键变更包括:
使用 Bitnami Secure Images(仅 latest 标签,适用于开发):
consoledocker run --name pytorch -d docker.io/bitnami/pytorch:latest
若需使用旧版本或非硬化镜像,从 Legacy 仓库拉取(不再更新):
consoledocker run --name pytorch-legacy -d docker.io/bitnamilegacy/pytorch:2.50.0
默认持久化路径为 /bitnami/pytorch,可通过 -v 参数挂载本地目录:
consoledocker run --name pytorch -v /local/path:/bitnami/pytorch -d docker.io/bitnami/pytorch:latest
使用以下命令安装名为 my-release 的 release:
consolehelm install my-release oci://registry-1.docker.io/bitnamicharts/pytorch
注:需将占位符替换为实际 Helm 仓库信息。Bitnami 官方仓库为
registry-1.docker.io( registry)和bitnamicharts(repository)。
| 参数名 | 描述 | 默认值 |
|---|---|---|
global.imageRegistry | 全局 Docker 镜像仓库 | "" |
global.imagePullSecrets | 全局 Docker 仓库密钥名称数组 | [] |
global.defaultStorageClass | 持久化卷的全局默认 StorageClass | "" |
global.storageClass | (已弃用)使用 global.defaultStorageClass 替代 | "" |
global.security.allowInsecureImages | 是否允许跳过镜像验证 | false |
global.compatibility.openshift.adaptSecurityContext | 适配 OpenShift 安全上下文(auto/force/disabled) | auto |
| 参数名 | 描述 | 默认值 |
|---|---|---|
kubeVersion | 覆盖 Kubernetes 版本 | "" |
nameOverride | 部分覆盖 release 名称模板 | "" |
commonLabels | 所有部署对象的标签 | {} |
commonAnnotations | 所有部署对象的注解 | {} |
fullnameOverride | 完全覆盖 release 名称模板 | "" |
extraDeploy | 额外部署的对象数组 | [] |
diagnosticMode.enabled | 启用诊断模式(禁用所有探针并覆盖命令) | false |
diagnosticMode.command | 诊断模式下覆盖所有容器的命令 | ["sleep"] |
diagnosticMode.args | 诊断模式下覆盖所有容器的参数 | ["infinity"] |
| 参数名 | 描述 | 默认值 |
|---|---|---|
image.registry | PyTorch 镜像仓库 | REGISTRY_NAME |
image.repository | PyTorch 镜像路径 | REPOSITORY_NAME/pytorch |
image.digest | 镜像摘要(sha256:xx 格式,设置后覆盖标签) | "" |
image.pullPolicy | 镜像拉取策略 | IfNotPresent |
image.pullSecrets | 镜像拉取密钥数组 | [] |
worldSize | 运行代码的节点数量 | 1 |
containerPorts.pytorch | PyTorch 主端口(对应环境变量 MASTER_PORT) | 49875 |
podSecurityContext.enabled | 是否启用 Pod 安全上下文 | true |
podSecurityContext.fsGroup | Pod 文件系统组 ID | 1001 |
containerSecurityContext.enabled | 是否启用容器安全上下文 | true |
containerSecurityContext.runAsUser | 容器运行用户 ID | 1001 |
containerSecurityContext.runAsGroup | 容器运行用户组 ID | 1001 |
PyTorch 镜像支持三种文件加载方式,优先级从高到低为:
现有 ConfigMap:通过 configMap=my-config-map 参数指定,镜像将直接使用该 ConfigMap 中的文件。
本地文件目录:将文件放入 files/ 目录,无需额外配置,镜像会自动加载。
Git 仓库克隆:通过以下参数配置 Git 仓库:
yamlcloneFilesFromGit.enabled: true cloneFilesFromGit.repository: [***] cloneFilesFromGit.revision: master
默认持久化路径为 /bitnami/pytorch,通过 PV 动态供应实现持久化。
由于镜像默认以非 root 用户运行,需调整持久化卷的权限以确保容器可写入数据:
volumePermissions.enabled: true。使用 Velero(Kubernetes 备份/恢复工具)备份和恢复部署:
详细步骤参考 Bitnami 备份恢复指南。
manifest unknown 错误
TLS 证书验证失败
DNS 解析超时
410 错误:版本过低
402 错误:流量耗尽
身份认证失败错误
429 限流错误
凭证保存错误
来自真实用户的反馈,见证轩辕镜像的优质服务