
https://github.com/scitrera/cuda-containers
本仓库包含针对NVIDIA DGX Spark系统优化的CUDA容器Dockerfile和构建配方,专注于vLLM、sglang、PyTorch以及多节点推理工作负载。
本项目的主要目标是提供稳定、版本化的预构建镜像,可在DGX Spark(支持Blackwell)上即开即用,同时也适合作为基础镜像用于自定义构建。
官方NVIDIA镜像往往滞后于最新版本,而其他社区镜像则优先考虑前沿功能而非版本控制和稳定性。
本仓库的目标是提供稳定、版本化的预构建镜像,可在DGX Spark(支持Blackwell)上即开即用。
与其他构建(例如eugr的仓库——社区标准)的主要架构差异在于:
对于sglang,官方提供的容器未持续更新。预计随着sglang对SM121支持的提升,这种情况可能会改变,但在此期间,Scitrera将尽最大努力维护与vLLM镜像类似的sglang镜像。
SGLang镜像同样针对DGX Spark优化,提供高性能推理运行时的替代方案。
最新版本
SGLang 0.5.8
scitrera/dgx-spark-sglang:0.5.8-t4
scitrera/dgx-spark-sglang:0.5.8-t5
如果需要构建自定义推理栈:
scitrera/dgx-spark-pytorch-dev:2.10.0-v2-cu131
nvidia/cuda:13.1.1-devel-ubuntu24.04构建scitrera/dgx-spark-pytorch-dev:2.10.0-cu131
nvidia/cuda:13.1.0-devel-ubuntu24.04构建推荐在以下场景使用此基础镜像:
vLLM和SGLang容器的标签遵循以下模式:
<version>-t<transformers-major>
示例:
0.13.0-t4 → vLLM 0.13.0 + Transformers 4.x0.5.8-t5 → SGLang 0.5.8 + Transformers 5.xbashdocker run \ --privileged \ --gpus all \ -it --rm \ --network host --ipc=host \ -v ~/.cache/huggingface:/root/.cache/huggingface \ scitrera/dgx-spark-sglang:0.5.8-t4 \ sglang serve \ --model-path Qwen/Qwen2.5-7B-Instruct \ --mem-fraction-static 0.4
主要组件版本嵌入为Docker标签。
bashdocker inspect scitrera/dgx-spark-vllm:0.14.0rc2-t4 \ --format '{{json .Config.Labels}}' | jq
示例输出:
json{ "dev.scitrera.cuda_version": "13.1.0", "dev.scitrera.flashinfer_version": "0.6.1", "dev.scitrera.nccl_version": "2.28.9-1", "dev.scitrera.torch_version": "2.10.0-rc6", "dev.scitrera.transformers_version": "4.57.5", "dev.scitrera.triton_version": "3.5.1", "dev.scitrera.vllm_version": "0.14.0rc2" }
本项目与NVIDIA无关。由scitrera.ai赞助和维护。


探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式
通过 Docker 登录认证访问私有仓库
无需登录使用专属域名
Kubernetes 集群配置 Containerd
K3s 轻量级 Kubernetes 镜像加速
VS Code Dev Containers 配置
Podman 容器引擎配置
HPC 科学计算容器配置
ghcr、Quay、nvcr 等镜像仓库
Harbor Proxy Repository 对接专属域名
Portainer Registries 加速拉取
Nexus3 Docker Proxy 内网缓存
需要其他帮助?请查看我们的 常见问题Docker 镜像访问常见问题解答 或 提交工单
manifest unknown
no matching manifest(架构)
invalid tar header(解压)
TLS 证书失败
DNS 超时
410 Gone 排查
402 与流量用尽
401 认证失败
429 限流
D-Bus 凭证提示
413 与超大单层
来自真实用户的反馈,见证轩辕镜像的优质服务