本站支持搜索的镜像仓库:Docker Hub、gcr.io、ghcr.io、quay.io、k8s.gcr.io、registry.gcr.io、elastic.co、mcr.microsoft.com
自GPU设备插件v0.12.0版本起,Docker Hub将不再发布新镜像。请使用NGC目录中的镜像:nvcr.io/nvidia/k8s-device-plugin
NVIDIA Kubernetes设备插件(k8s-device-plugin)是一个符合Kubernetes设备插件框架规范的组件,用于在Kubernetes集群中实现NVIDIA GPU资源的自动发现、管理和调度。该插件允许集群中的Pod通过Kubernetes API请求GPU资源,并确保GPU资源被正确分配和隔离。
主要用途:作为Kubernetes节点级组件,为集群提供GPU资源的抽象和管理能力,使容器化应用能够便捷地使用NVIDIA GPU进行加速计算。
适用于需要在Kubernetes集群中运行GPU加速工作负载的场景,包括但不限于:
适用环境:
| 版本号 | 标签名称 | 基础镜像 | Dockerfile链接 |
|---|---|---|---|
| v0.11.0 | v0.11.0, v0.11.0-ubuntu20.04 | Ubuntu 20.04 | Dockerfile |
| v0.11.0 | v0.11.0-ubi8 | Red Hat UBI 8 | Dockerfile |
| v0.10.0 | v0.10.0, v0.10.0-ubuntu20.04 | Ubuntu 20.04 | Dockerfile |
| v0.10.0 | v0.10.0-ubi8 | Red Hat UBI 8 | Dockerfile |
| v0.9.0 | latest, v0.9.0, v0.9.0-ubuntu16.04 | Ubuntu 16.04 | Dockerfile |
| v0.9.0 | v0.9.0-centos7 | CentOS 7 | Dockerfile |
| v0.9.0 | v0.9.0-ubi8 | Red Hat UBI 8 | Dockerfile |
| v0.8.x | v0.8.2-ubuntu16.04, v0.8.2-centos7, v0.8.2-ubi8等 | Ubuntu 16.04/CentOS 7/UBI 8 | v0.8.2 Dockerfiles |
包含v0.7.3、v0.7.2、v0.6.0、v0.5.0等版本,支持Ubuntu 16.04、CentOS 7、UBI 8基础镜像,标签格式为v<版本>-<基础镜像>(如v0.7.0-ubuntu16.04)。
Dockerfile链接示例:v0.7.0 Ubuntu 16.04
包含1.0.0-beta、1.0.0-beta1至1.0.0-beta6等版本,标签格式为<beta版本>-<基础镜像>(如1.0.0-beta6-centos7)。
包含1.11、1.10、1.9等版本,支持Ubuntu 16.04和CentOS 7基础镜像,标签格式为<版本>-<基础镜像>(如1.11-ubuntu16.04)。
通过Kubernetes DaemonSet在集群所有GPU节点上部署设备插件:
apiVersion: apps/v1 kind: DaemonSet metadata: name: nvidia-device-plugin-daemonset namespace: kube-system spec: selector: matchLabels: name: nvidia-device-plugin-ds template: metadata: labels: name: nvidia-device-plugin-ds spec: tolerations: - key: nvidia.com/gpu operator: Exists effect: NoSchedule containers: - image: nvcr.io/nvidia/k8s-device-plugin:v0.14.1 # 使用NGC最新镜像 name: nvidia-device-plugin-ctr securityContext: allowPrivilegeEscalation: false capabilities: drop: ["ALL"] volumeMounts: - name: device-plugin mountPath: /var/lib/kubelet/device-plugins volumes: - name: device-plugin hostPath: path: /var/lib/kubelet/device-plugins
部署命令:
kubectl apply -f [***]
前置条件:
[plugins."io.containerd.grpc.v1.cri".containerd.runtimes.nvidia])版本兼容性:
资源验证: 部署后可通过以下命令验证GPU资源是否被正确识别:
kubectl describe nodes | grep nvidia.com/gpu
免费版仅支持 Docker Hub 加速,不承诺可用性和速度;专业版支持更多镜像源,保证可用性和稳定速度,提供优先客服响应。
免费版仅支持 docker.io;专业版支持 docker.io、gcr.io、ghcr.io、registry.k8s.io、nvcr.io、quay.io、mcr.microsoft.com、docker.elastic.co 等。
当返回 402 Payment Required 错误时,表示流量已耗尽,需要充值流量包以恢复服务。
通常由 Docker 版本过低导致,需要升级到 20.x 或更高版本以支持 V2 协议。
先检查 Docker 版本,版本过低则升级;版本正常则验证镜像信息是否正确。
使用 docker tag 命令为镜像打上新标签,去掉域名前缀,使镜像名称更简洁。
探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式
通过 Docker 登录方式配置轩辕镜像加速服务,包含7个详细步骤
在 Linux 系统上配置轩辕镜像源,支持主流发行版
在 Docker Desktop 中配置轩辕镜像加速,适用于桌面系统
在 Docker Compose 中使用轩辕镜像加速,支持容器编排
在 k8s 中配置 containerd 使用轩辕镜像加速
在宝塔面板中配置轩辕镜像加速,提升服务器管理效率
在 Synology 群晖NAS系统中配置轩辕镜像加速
在飞牛fnOS系统中配置轩辕镜像加速
在极空间NAS中配置轩辕镜像加速
在爱快ikuai系统中配置轩辕镜像加速
在绿联NAS系统中配置轩辕镜像加速
在威联通NAS系统中配置轩辕镜像加速
在 Podman 中配置轩辕镜像加速,支持多系统
配置轩辕镜像加速9大主流镜像仓库,包含详细配置步骤
无需登录即可使用轩辕镜像加速服务,更加便捷高效
需要其他帮助?请查看我们的 常见问题 或 官方QQ群: 13763429