热门搜索:
quay.io/ascend/vllm-ascend

quay.io/ascend/vllm-ascend:v0.9.2rc1-310p-openeuler

quay.io
v0.9.2rc1-310p-openeulerquay.iolinux/amd642026-05-07
quay.io/ascend/vllm-ascend 镜像技术说明 技术定位 该镜像通常基于 vLLM(高性能大语言模型推理库)构建,针对 华为昇腾(Ascend) 硬件平台优化,提供大语言模型(LLM)高效推理的容器化运行环境。镜像集成昇腾异构计算架构(如CANN)与vLLM的高性能推理能力,适用于在昇腾芯片上部署低延迟、高吞吐量的LLM服务。 典型使用场景 大语言模型推理部署:在昇腾AI加速卡(如Ascend 310P、A2、A3系列)上运行开源LLM(如DeepSeek、GLM等),支持企业级推理服务。 昇腾生态适配验证:作为vLLM在昇腾硬件上的标准化运行环境,用于模型迁移、性能调优及兼容性测试。 边缘与云端推理:结合Kubernetes等容器编排平台,实现LLM推理服务的弹性扩缩与集群化管理。 镜像标签说明 标签命名包含硬件架构、软件版本、操作系统及模型优化等信息,典型分类如下: 架构与硬件适配: arm-a3/x86-a2:分别对应ARM/x86架构,适配昇腾A3/A2系列芯片; 310p:针对昇腾310P芯片优化。 操作系统: 含openeuler标签的镜像基于欧拉(OpenEuler)操作系统构建,适配国产化软件栈。 版本分支: releases-v0.13.0/v0.18.0:对应vLLM稳定版本; main/nightly-main:主分支或每日构建版本,包含最新特性(稳定性需验证)。 模型与优化: deepseekv4/glm5:可能针对DeepSeek-V4、GLM-5等模型优化; bailing-flash:推测为特定推理加速技术(如“百灵”优化)的版本。 使用提示 拉取镜像时需指定具体标签(如昇腾A3芯片+OpenEuler环境): 运行前需确保主机已安装昇腾驱动及容器运行时(如Docker),并配置昇腾设备访问权限。 典型部署流程需结合vLLM启动参数(如--model指定模型路径、--device ascend启用昇腾设备)。
quay.io/ascend/vllm-ascend

quay.io/ascend/vllm-ascend:v0.9.1rc1-310p

quay.io
v0.9.1rc1-310pquay.iolinux/amd642026-05-07
quay.io/ascend/vllm-ascend 镜像技术说明 技术定位 该镜像通常基于 vLLM(高性能大语言模型推理库)构建,针对 华为昇腾(Ascend) 硬件平台优化,提供大语言模型(LLM)高效推理的容器化运行环境。镜像集成昇腾异构计算架构(如CANN)与vLLM的高性能推理能力,适用于在昇腾芯片上部署低延迟、高吞吐量的LLM服务。 典型使用场景 大语言模型推理部署:在昇腾AI加速卡(如Ascend 310P、A2、A3系列)上运行开源LLM(如DeepSeek、GLM等),支持企业级推理服务。 昇腾生态适配验证:作为vLLM在昇腾硬件上的标准化运行环境,用于模型迁移、性能调优及兼容性测试。 边缘与云端推理:结合Kubernetes等容器编排平台,实现LLM推理服务的弹性扩缩与集群化管理。 镜像标签说明 标签命名包含硬件架构、软件版本、操作系统及模型优化等信息,典型分类如下: 架构与硬件适配: arm-a3/x86-a2:分别对应ARM/x86架构,适配昇腾A3/A2系列芯片; 310p:针对昇腾310P芯片优化。 操作系统: 含openeuler标签的镜像基于欧拉(OpenEuler)操作系统构建,适配国产化软件栈。 版本分支: releases-v0.13.0/v0.18.0:对应vLLM稳定版本; main/nightly-main:主分支或每日构建版本,包含最新特性(稳定性需验证)。 模型与优化: deepseekv4/glm5:可能针对DeepSeek-V4、GLM-5等模型优化; bailing-flash:推测为特定推理加速技术(如“百灵”优化)的版本。 使用提示 拉取镜像时需指定具体标签(如昇腾A3芯片+OpenEuler环境): 运行前需确保主机已安装昇腾驱动及容器运行时(如Docker),并配置昇腾设备访问权限。 典型部署流程需结合vLLM启动参数(如--model指定模型路径、--device ascend启用昇腾设备)。
quay.io/ascend/vllm-ascend

quay.io/ascend/vllm-ascend:v0.8.5rc1

quay.io
v0.8.5rc1quay.iolinux/amd642026-05-07
quay.io/ascend/vllm-ascend 镜像技术说明 技术定位 该镜像通常基于 vLLM(高性能大语言模型推理库)构建,针对 华为昇腾(Ascend) 硬件平台优化,提供大语言模型(LLM)高效推理的容器化运行环境。镜像集成昇腾异构计算架构(如CANN)与vLLM的高性能推理能力,适用于在昇腾芯片上部署低延迟、高吞吐量的LLM服务。 典型使用场景 大语言模型推理部署:在昇腾AI加速卡(如Ascend 310P、A2、A3系列)上运行开源LLM(如DeepSeek、GLM等),支持企业级推理服务。 昇腾生态适配验证:作为vLLM在昇腾硬件上的标准化运行环境,用于模型迁移、性能调优及兼容性测试。 边缘与云端推理:结合Kubernetes等容器编排平台,实现LLM推理服务的弹性扩缩与集群化管理。 镜像标签说明 标签命名包含硬件架构、软件版本、操作系统及模型优化等信息,典型分类如下: 架构与硬件适配: arm-a3/x86-a2:分别对应ARM/x86架构,适配昇腾A3/A2系列芯片; 310p:针对昇腾310P芯片优化。 操作系统: 含openeuler标签的镜像基于欧拉(OpenEuler)操作系统构建,适配国产化软件栈。 版本分支: releases-v0.13.0/v0.18.0:对应vLLM稳定版本; main/nightly-main:主分支或每日构建版本,包含最新特性(稳定性需验证)。 模型与优化: deepseekv4/glm5:可能针对DeepSeek-V4、GLM-5等模型优化; bailing-flash:推测为特定推理加速技术(如“百灵”优化)的版本。 使用提示 拉取镜像时需指定具体标签(如昇腾A3芯片+OpenEuler环境): 运行前需确保主机已安装昇腾驱动及容器运行时(如Docker),并配置昇腾设备访问权限。 典型部署流程需结合vLLM启动参数(如--model指定模型路径、--device ascend启用昇腾设备)。
quay.io/ascend/vllm-ascend

quay.io/ascend/vllm-ascend:v0.8.4rc1

quay.io
v0.8.4rc1quay.iolinux/amd642026-05-07
quay.io/ascend/vllm-ascend 镜像技术说明 技术定位 该镜像通常基于 vLLM(高性能大语言模型推理库)构建,针对 华为昇腾(Ascend) 硬件平台优化,提供大语言模型(LLM)高效推理的容器化运行环境。镜像集成昇腾异构计算架构(如CANN)与vLLM的高性能推理能力,适用于在昇腾芯片上部署低延迟、高吞吐量的LLM服务。 典型使用场景 大语言模型推理部署:在昇腾AI加速卡(如Ascend 310P、A2、A3系列)上运行开源LLM(如DeepSeek、GLM等),支持企业级推理服务。 昇腾生态适配验证:作为vLLM在昇腾硬件上的标准化运行环境,用于模型迁移、性能调优及兼容性测试。 边缘与云端推理:结合Kubernetes等容器编排平台,实现LLM推理服务的弹性扩缩与集群化管理。 镜像标签说明 标签命名包含硬件架构、软件版本、操作系统及模型优化等信息,典型分类如下: 架构与硬件适配: arm-a3/x86-a2:分别对应ARM/x86架构,适配昇腾A3/A2系列芯片; 310p:针对昇腾310P芯片优化。 操作系统: 含openeuler标签的镜像基于欧拉(OpenEuler)操作系统构建,适配国产化软件栈。 版本分支: releases-v0.13.0/v0.18.0:对应vLLM稳定版本; main/nightly-main:主分支或每日构建版本,包含最新特性(稳定性需验证)。 模型与优化: deepseekv4/glm5:可能针对DeepSeek-V4、GLM-5等模型优化; bailing-flash:推测为特定推理加速技术(如“百灵”优化)的版本。 使用提示 拉取镜像时需指定具体标签(如昇腾A3芯片+OpenEuler环境): 运行前需确保主机已安装昇腾驱动及容器运行时(如Docker),并配置昇腾设备访问权限。 典型部署流程需结合vLLM启动参数(如--model指定模型路径、--device ascend启用昇腾设备)。
quay.io/ascend/vllm-ascend

quay.io/ascend/vllm-ascend:v0.7.3.post1-openeuler

quay.io
v0.7.3.post1-openeulerquay.iolinux/amd642026-05-07
quay.io/ascend/vllm-ascend 镜像技术说明 技术定位 该镜像通常基于 vLLM(高性能大语言模型推理库)构建,针对 华为昇腾(Ascend) 硬件平台优化,提供大语言模型(LLM)高效推理的容器化运行环境。镜像集成昇腾异构计算架构(如CANN)与vLLM的高性能推理能力,适用于在昇腾芯片上部署低延迟、高吞吐量的LLM服务。 典型使用场景 大语言模型推理部署:在昇腾AI加速卡(如Ascend 310P、A2、A3系列)上运行开源LLM(如DeepSeek、GLM等),支持企业级推理服务。 昇腾生态适配验证:作为vLLM在昇腾硬件上的标准化运行环境,用于模型迁移、性能调优及兼容性测试。 边缘与云端推理:结合Kubernetes等容器编排平台,实现LLM推理服务的弹性扩缩与集群化管理。 镜像标签说明 标签命名包含硬件架构、软件版本、操作系统及模型优化等信息,典型分类如下: 架构与硬件适配: arm-a3/x86-a2:分别对应ARM/x86架构,适配昇腾A3/A2系列芯片; 310p:针对昇腾310P芯片优化。 操作系统: 含openeuler标签的镜像基于欧拉(OpenEuler)操作系统构建,适配国产化软件栈。 版本分支: releases-v0.13.0/v0.18.0:对应vLLM稳定版本; main/nightly-main:主分支或每日构建版本,包含最新特性(稳定性需验证)。 模型与优化: deepseekv4/glm5:可能针对DeepSeek-V4、GLM-5等模型优化; bailing-flash:推测为特定推理加速技术(如“百灵”优化)的版本。 使用提示 拉取镜像时需指定具体标签(如昇腾A3芯片+OpenEuler环境): 运行前需确保主机已安装昇腾驱动及容器运行时(如Docker),并配置昇腾设备访问权限。 典型部署流程需结合vLLM启动参数(如--model指定模型路径、--device ascend启用昇腾设备)。
quay.io/ascend/vllm-ascend

quay.io/ascend/vllm-ascend:v0.7.3.post1

quay.io
v0.7.3.post1quay.iolinux/amd642026-05-07
quay.io/ascend/vllm-ascend 镜像技术说明 技术定位 该镜像通常基于 vLLM(高性能大语言模型推理库)构建,针对 华为昇腾(Ascend) 硬件平台优化,提供大语言模型(LLM)高效推理的容器化运行环境。镜像集成昇腾异构计算架构(如CANN)与vLLM的高性能推理能力,适用于在昇腾芯片上部署低延迟、高吞吐量的LLM服务。 典型使用场景 大语言模型推理部署:在昇腾AI加速卡(如Ascend 310P、A2、A3系列)上运行开源LLM(如DeepSeek、GLM等),支持企业级推理服务。 昇腾生态适配验证:作为vLLM在昇腾硬件上的标准化运行环境,用于模型迁移、性能调优及兼容性测试。 边缘与云端推理:结合Kubernetes等容器编排平台,实现LLM推理服务的弹性扩缩与集群化管理。 镜像标签说明 标签命名包含硬件架构、软件版本、操作系统及模型优化等信息,典型分类如下: 架构与硬件适配: arm-a3/x86-a2:分别对应ARM/x86架构,适配昇腾A3/A2系列芯片; 310p:针对昇腾310P芯片优化。 操作系统: 含openeuler标签的镜像基于欧拉(OpenEuler)操作系统构建,适配国产化软件栈。 版本分支: releases-v0.13.0/v0.18.0:对应vLLM稳定版本; main/nightly-main:主分支或每日构建版本,包含最新特性(稳定性需验证)。 模型与优化: deepseekv4/glm5:可能针对DeepSeek-V4、GLM-5等模型优化; bailing-flash:推测为特定推理加速技术(如“百灵”优化)的版本。 使用提示 拉取镜像时需指定具体标签(如昇腾A3芯片+OpenEuler环境): 运行前需确保主机已安装昇腾驱动及容器运行时(如Docker),并配置昇腾设备访问权限。 典型部署流程需结合vLLM启动参数(如--model指定模型路径、--device ascend启用昇腾设备)。
quay.io/ascend/vllm-ascend

quay.io/ascend/vllm-ascend:v0.10.0rc1-310p

quay.io
v0.10.0rc1-310pquay.iolinux/amd642026-05-07
quay.io/ascend/vllm-ascend 镜像技术说明 技术定位 该镜像通常基于 vLLM(高性能大语言模型推理库)构建,针对 华为昇腾(Ascend) 硬件平台优化,提供大语言模型(LLM)高效推理的容器化运行环境。镜像集成昇腾异构计算架构(如CANN)与vLLM的高性能推理能力,适用于在昇腾芯片上部署低延迟、高吞吐量的LLM服务。 典型使用场景 大语言模型推理部署:在昇腾AI加速卡(如Ascend 310P、A2、A3系列)上运行开源LLM(如DeepSeek、GLM等),支持企业级推理服务。 昇腾生态适配验证:作为vLLM在昇腾硬件上的标准化运行环境,用于模型迁移、性能调优及兼容性测试。 边缘与云端推理:结合Kubernetes等容器编排平台,实现LLM推理服务的弹性扩缩与集群化管理。 镜像标签说明 标签命名包含硬件架构、软件版本、操作系统及模型优化等信息,典型分类如下: 架构与硬件适配: arm-a3/x86-a2:分别对应ARM/x86架构,适配昇腾A3/A2系列芯片; 310p:针对昇腾310P芯片优化。 操作系统: 含openeuler标签的镜像基于欧拉(OpenEuler)操作系统构建,适配国产化软件栈。 版本分支: releases-v0.13.0/v0.18.0:对应vLLM稳定版本; main/nightly-main:主分支或每日构建版本,包含最新特性(稳定性需验证)。 模型与优化: deepseekv4/glm5:可能针对DeepSeek-V4、GLM-5等模型优化; bailing-flash:推测为特定推理加速技术(如“百灵”优化)的版本。 使用提示 拉取镜像时需指定具体标签(如昇腾A3芯片+OpenEuler环境): 运行前需确保主机已安装昇腾驱动及容器运行时(如Docker),并配置昇腾设备访问权限。 典型部署流程需结合vLLM启动参数(如--model指定模型路径、--device ascend启用昇腾设备)。
quay.io/ascend/vllm-ascend

quay.io/ascend/vllm-ascend:latest

quay.io
latestquay.iolinux/amd642026-05-07
quay.io/ascend/vllm-ascend 镜像技术说明 技术定位 该镜像通常基于 vLLM(高性能大语言模型推理库)构建,针对 华为昇腾(Ascend) 硬件平台优化,提供大语言模型(LLM)高效推理的容器化运行环境。镜像集成昇腾异构计算架构(如CANN)与vLLM的高性能推理能力,适用于在昇腾芯片上部署低延迟、高吞吐量的LLM服务。 典型使用场景 大语言模型推理部署:在昇腾AI加速卡(如Ascend 310P、A2、A3系列)上运行开源LLM(如DeepSeek、GLM等),支持企业级推理服务。 昇腾生态适配验证:作为vLLM在昇腾硬件上的标准化运行环境,用于模型迁移、性能调优及兼容性测试。 边缘与云端推理:结合Kubernetes等容器编排平台,实现LLM推理服务的弹性扩缩与集群化管理。 镜像标签说明 标签命名包含硬件架构、软件版本、操作系统及模型优化等信息,典型分类如下: 架构与硬件适配: arm-a3/x86-a2:分别对应ARM/x86架构,适配昇腾A3/A2系列芯片; 310p:针对昇腾310P芯片优化。 操作系统: 含openeuler标签的镜像基于欧拉(OpenEuler)操作系统构建,适配国产化软件栈。 版本分支: releases-v0.13.0/v0.18.0:对应vLLM稳定版本; main/nightly-main:主分支或每日构建版本,包含最新特性(稳定性需验证)。 模型与优化: deepseekv4/glm5:可能针对DeepSeek-V4、GLM-5等模型优化; bailing-flash:推测为特定推理加速技术(如“百灵”优化)的版本。 使用提示 拉取镜像时需指定具体标签(如昇腾A3芯片+OpenEuler环境): 运行前需确保主机已安装昇腾驱动及容器运行时(如Docker),并配置昇腾设备访问权限。 典型部署流程需结合vLLM启动参数(如--model指定模型路径、--device ascend启用昇腾设备)。
quay.io/ascend/vllm-ascend

quay.io/ascend/vllm-ascend:main

quay.io
mainquay.iolinux/amd642026-05-07
quay.io/ascend/vllm-ascend 镜像技术说明 技术定位 该镜像通常基于 vLLM(高性能大语言模型推理库)构建,针对 华为昇腾(Ascend) 硬件平台优化,提供大语言模型(LLM)高效推理的容器化运行环境。镜像集成昇腾异构计算架构(如CANN)与vLLM的高性能推理能力,适用于在昇腾芯片上部署低延迟、高吞吐量的LLM服务。 典型使用场景 大语言模型推理部署:在昇腾AI加速卡(如Ascend 310P、A2、A3系列)上运行开源LLM(如DeepSeek、GLM等),支持企业级推理服务。 昇腾生态适配验证:作为vLLM在昇腾硬件上的标准化运行环境,用于模型迁移、性能调优及兼容性测试。 边缘与云端推理:结合Kubernetes等容器编排平台,实现LLM推理服务的弹性扩缩与集群化管理。 镜像标签说明 标签命名包含硬件架构、软件版本、操作系统及模型优化等信息,典型分类如下: 架构与硬件适配: arm-a3/x86-a2:分别对应ARM/x86架构,适配昇腾A3/A2系列芯片; 310p:针对昇腾310P芯片优化。 操作系统: 含openeuler标签的镜像基于欧拉(OpenEuler)操作系统构建,适配国产化软件栈。 版本分支: releases-v0.13.0/v0.18.0:对应vLLM稳定版本; main/nightly-main:主分支或每日构建版本,包含最新特性(稳定性需验证)。 模型与优化: deepseekv4/glm5:可能针对DeepSeek-V4、GLM-5等模型优化; bailing-flash:推测为特定推理加速技术(如“百灵”优化)的版本。 使用提示 拉取镜像时需指定具体标签(如昇腾A3芯片+OpenEuler环境): 运行前需确保主机已安装昇腾驱动及容器运行时(如Docker),并配置昇腾设备访问权限。 典型部署流程需结合vLLM启动参数(如--model指定模型路径、--device ascend启用昇腾设备)。
quay.io/ascend/vllm-ascend

quay.io/ascend/vllm-ascend:main-310p

quay.io
main-310pquay.iolinux/amd642026-05-07
quay.io/ascend/vllm-ascend 镜像技术说明 技术定位 该镜像通常基于 vLLM(高性能大语言模型推理库)构建,针对 华为昇腾(Ascend) 硬件平台优化,提供大语言模型(LLM)高效推理的容器化运行环境。镜像集成昇腾异构计算架构(如CANN)与vLLM的高性能推理能力,适用于在昇腾芯片上部署低延迟、高吞吐量的LLM服务。 典型使用场景 大语言模型推理部署:在昇腾AI加速卡(如Ascend 310P、A2、A3系列)上运行开源LLM(如DeepSeek、GLM等),支持企业级推理服务。 昇腾生态适配验证:作为vLLM在昇腾硬件上的标准化运行环境,用于模型迁移、性能调优及兼容性测试。 边缘与云端推理:结合Kubernetes等容器编排平台,实现LLM推理服务的弹性扩缩与集群化管理。 镜像标签说明 标签命名包含硬件架构、软件版本、操作系统及模型优化等信息,典型分类如下: 架构与硬件适配: arm-a3/x86-a2:分别对应ARM/x86架构,适配昇腾A3/A2系列芯片; 310p:针对昇腾310P芯片优化。 操作系统: 含openeuler标签的镜像基于欧拉(OpenEuler)操作系统构建,适配国产化软件栈。 版本分支: releases-v0.13.0/v0.18.0:对应vLLM稳定版本; main/nightly-main:主分支或每日构建版本,包含最新特性(稳定性需验证)。 模型与优化: deepseekv4/glm5:可能针对DeepSeek-V4、GLM-5等模型优化; bailing-flash:推测为特定推理加速技术(如“百灵”优化)的版本。 使用提示 拉取镜像时需指定具体标签(如昇腾A3芯片+OpenEuler环境): 运行前需确保主机已安装昇腾驱动及容器运行时(如Docker),并配置昇腾设备访问权限。 典型部署流程需结合vLLM启动参数(如--model指定模型路径、--device ascend启用昇腾设备)。
quay.io/ascend/vllm-ascend

quay.io/ascend/vllm-ascend:main-310p-openeuler

quay.io
main-310p-openeulerquay.iolinux/amd642026-05-07
quay.io/ascend/vllm-ascend 镜像技术说明 技术定位 该镜像通常基于 vLLM(高性能大语言模型推理库)构建,针对 华为昇腾(Ascend) 硬件平台优化,提供大语言模型(LLM)高效推理的容器化运行环境。镜像集成昇腾异构计算架构(如CANN)与vLLM的高性能推理能力,适用于在昇腾芯片上部署低延迟、高吞吐量的LLM服务。 典型使用场景 大语言模型推理部署:在昇腾AI加速卡(如Ascend 310P、A2、A3系列)上运行开源LLM(如DeepSeek、GLM等),支持企业级推理服务。 昇腾生态适配验证:作为vLLM在昇腾硬件上的标准化运行环境,用于模型迁移、性能调优及兼容性测试。 边缘与云端推理:结合Kubernetes等容器编排平台,实现LLM推理服务的弹性扩缩与集群化管理。 镜像标签说明 标签命名包含硬件架构、软件版本、操作系统及模型优化等信息,典型分类如下: 架构与硬件适配: arm-a3/x86-a2:分别对应ARM/x86架构,适配昇腾A3/A2系列芯片; 310p:针对昇腾310P芯片优化。 操作系统: 含openeuler标签的镜像基于欧拉(OpenEuler)操作系统构建,适配国产化软件栈。 版本分支: releases-v0.13.0/v0.18.0:对应vLLM稳定版本; main/nightly-main:主分支或每日构建版本,包含最新特性(稳定性需验证)。 模型与优化: deepseekv4/glm5:可能针对DeepSeek-V4、GLM-5等模型优化; bailing-flash:推测为特定推理加速技术(如“百灵”优化)的版本。 使用提示 拉取镜像时需指定具体标签(如昇腾A3芯片+OpenEuler环境): 运行前需确保主机已安装昇腾驱动及容器运行时(如Docker),并配置昇腾设备访问权限。 典型部署流程需结合vLLM启动参数(如--model指定模型路径、--device ascend启用昇腾设备)。
quay.io/ascend/vllm-ascend

quay.io/ascend/vllm-ascend:main-a3

quay.io
main-a3quay.iolinux/amd642026-05-07
quay.io/ascend/vllm-ascend 镜像技术说明 技术定位 该镜像通常基于 vLLM(高性能大语言模型推理库)构建,针对 华为昇腾(Ascend) 硬件平台优化,提供大语言模型(LLM)高效推理的容器化运行环境。镜像集成昇腾异构计算架构(如CANN)与vLLM的高性能推理能力,适用于在昇腾芯片上部署低延迟、高吞吐量的LLM服务。 典型使用场景 大语言模型推理部署:在昇腾AI加速卡(如Ascend 310P、A2、A3系列)上运行开源LLM(如DeepSeek、GLM等),支持企业级推理服务。 昇腾生态适配验证:作为vLLM在昇腾硬件上的标准化运行环境,用于模型迁移、性能调优及兼容性测试。 边缘与云端推理:结合Kubernetes等容器编排平台,实现LLM推理服务的弹性扩缩与集群化管理。 镜像标签说明 标签命名包含硬件架构、软件版本、操作系统及模型优化等信息,典型分类如下: 架构与硬件适配: arm-a3/x86-a2:分别对应ARM/x86架构,适配昇腾A3/A2系列芯片; 310p:针对昇腾310P芯片优化。 操作系统: 含openeuler标签的镜像基于欧拉(OpenEuler)操作系统构建,适配国产化软件栈。 版本分支: releases-v0.13.0/v0.18.0:对应vLLM稳定版本; main/nightly-main:主分支或每日构建版本,包含最新特性(稳定性需验证)。 模型与优化: deepseekv4/glm5:可能针对DeepSeek-V4、GLM-5等模型优化; bailing-flash:推测为特定推理加速技术(如“百灵”优化)的版本。 使用提示 拉取镜像时需指定具体标签(如昇腾A3芯片+OpenEuler环境): 运行前需确保主机已安装昇腾驱动及容器运行时(如Docker),并配置昇腾设备访问权限。 典型部署流程需结合vLLM启动参数(如--model指定模型路径、--device ascend启用昇腾设备)。
quay.io/ascend/vllm-ascend

quay.io/ascend/vllm-ascend:main-a3-openeuler

quay.io
main-a3-openeulerquay.iolinux/amd642026-05-07
quay.io/ascend/vllm-ascend 镜像技术说明 技术定位 该镜像通常基于 vLLM(高性能大语言模型推理库)构建,针对 华为昇腾(Ascend) 硬件平台优化,提供大语言模型(LLM)高效推理的容器化运行环境。镜像集成昇腾异构计算架构(如CANN)与vLLM的高性能推理能力,适用于在昇腾芯片上部署低延迟、高吞吐量的LLM服务。 典型使用场景 大语言模型推理部署:在昇腾AI加速卡(如Ascend 310P、A2、A3系列)上运行开源LLM(如DeepSeek、GLM等),支持企业级推理服务。 昇腾生态适配验证:作为vLLM在昇腾硬件上的标准化运行环境,用于模型迁移、性能调优及兼容性测试。 边缘与云端推理:结合Kubernetes等容器编排平台,实现LLM推理服务的弹性扩缩与集群化管理。 镜像标签说明 标签命名包含硬件架构、软件版本、操作系统及模型优化等信息,典型分类如下: 架构与硬件适配: arm-a3/x86-a2:分别对应ARM/x86架构,适配昇腾A3/A2系列芯片; 310p:针对昇腾310P芯片优化。 操作系统: 含openeuler标签的镜像基于欧拉(OpenEuler)操作系统构建,适配国产化软件栈。 版本分支: releases-v0.13.0/v0.18.0:对应vLLM稳定版本; main/nightly-main:主分支或每日构建版本,包含最新特性(稳定性需验证)。 模型与优化: deepseekv4/glm5:可能针对DeepSeek-V4、GLM-5等模型优化; bailing-flash:推测为特定推理加速技术(如“百灵”优化)的版本。 使用提示 拉取镜像时需指定具体标签(如昇腾A3芯片+OpenEuler环境): 运行前需确保主机已安装昇腾驱动及容器运行时(如Docker),并配置昇腾设备访问权限。 典型部署流程需结合vLLM启动参数(如--model指定模型路径、--device ascend启用昇腾设备)。
quay.io/ascend/vllm-ascend

quay.io/ascend/vllm-ascend:main-openeuler

quay.io
main-openeulerquay.iolinux/amd642026-05-07
quay.io/ascend/vllm-ascend 镜像技术说明 技术定位 该镜像通常基于 vLLM(高性能大语言模型推理库)构建,针对 华为昇腾(Ascend) 硬件平台优化,提供大语言模型(LLM)高效推理的容器化运行环境。镜像集成昇腾异构计算架构(如CANN)与vLLM的高性能推理能力,适用于在昇腾芯片上部署低延迟、高吞吐量的LLM服务。 典型使用场景 大语言模型推理部署:在昇腾AI加速卡(如Ascend 310P、A2、A3系列)上运行开源LLM(如DeepSeek、GLM等),支持企业级推理服务。 昇腾生态适配验证:作为vLLM在昇腾硬件上的标准化运行环境,用于模型迁移、性能调优及兼容性测试。 边缘与云端推理:结合Kubernetes等容器编排平台,实现LLM推理服务的弹性扩缩与集群化管理。 镜像标签说明 标签命名包含硬件架构、软件版本、操作系统及模型优化等信息,典型分类如下: 架构与硬件适配: arm-a3/x86-a2:分别对应ARM/x86架构,适配昇腾A3/A2系列芯片; 310p:针对昇腾310P芯片优化。 操作系统: 含openeuler标签的镜像基于欧拉(OpenEuler)操作系统构建,适配国产化软件栈。 版本分支: releases-v0.13.0/v0.18.0:对应vLLM稳定版本; main/nightly-main:主分支或每日构建版本,包含最新特性(稳定性需验证)。 模型与优化: deepseekv4/glm5:可能针对DeepSeek-V4、GLM-5等模型优化; bailing-flash:推测为特定推理加速技术(如“百灵”优化)的版本。 使用提示 拉取镜像时需指定具体标签(如昇腾A3芯片+OpenEuler环境): 运行前需确保主机已安装昇腾驱动及容器运行时(如Docker),并配置昇腾设备访问权限。 典型部署流程需结合vLLM启动参数(如--model指定模型路径、--device ascend启用昇腾设备)。
quay.io/ascend/vllm-ascend

quay.io/ascend/vllm-ascend:releases-v0.13.0

quay.io
releases-v0.13.0quay.iolinux/amd642026-05-07
quay.io/ascend/vllm-ascend 镜像技术说明 技术定位 该镜像通常基于 vLLM(高性能大语言模型推理库)构建,针对 华为昇腾(Ascend) 硬件平台优化,提供大语言模型(LLM)高效推理的容器化运行环境。镜像集成昇腾异构计算架构(如CANN)与vLLM的高性能推理能力,适用于在昇腾芯片上部署低延迟、高吞吐量的LLM服务。 典型使用场景 大语言模型推理部署:在昇腾AI加速卡(如Ascend 310P、A2、A3系列)上运行开源LLM(如DeepSeek、GLM等),支持企业级推理服务。 昇腾生态适配验证:作为vLLM在昇腾硬件上的标准化运行环境,用于模型迁移、性能调优及兼容性测试。 边缘与云端推理:结合Kubernetes等容器编排平台,实现LLM推理服务的弹性扩缩与集群化管理。 镜像标签说明 标签命名包含硬件架构、软件版本、操作系统及模型优化等信息,典型分类如下: 架构与硬件适配: arm-a3/x86-a2:分别对应ARM/x86架构,适配昇腾A3/A2系列芯片; 310p:针对昇腾310P芯片优化。 操作系统: 含openeuler标签的镜像基于欧拉(OpenEuler)操作系统构建,适配国产化软件栈。 版本分支: releases-v0.13.0/v0.18.0:对应vLLM稳定版本; main/nightly-main:主分支或每日构建版本,包含最新特性(稳定性需验证)。 模型与优化: deepseekv4/glm5:可能针对DeepSeek-V4、GLM-5等模型优化; bailing-flash:推测为特定推理加速技术(如“百灵”优化)的版本。 使用提示 拉取镜像时需指定具体标签(如昇腾A3芯片+OpenEuler环境): 运行前需确保主机已安装昇腾驱动及容器运行时(如Docker),并配置昇腾设备访问权限。 典型部署流程需结合vLLM启动参数(如--model指定模型路径、--device ascend启用昇腾设备)。
1

相关博客

MinerU Docker 部署指南:PDF 结构化解析服务实践

MinerU 是一款面向开发者与科研用户的容器化应用,专为 vLLM 后端服务设计,提供高效的文档解析与处理能力。通过 Docker 容器化部署 MinerU,可以简化安装流程、确保环境一致性,并便于在不同环境中快速迁移和扩展。 本指南将详细介绍 MinerU 的 Docker 容器化部署方案,包括环境准备、镜像拉取、容器部署、功能测试及生产环境配置建议,旨在帮助用户快速搭建稳定可靠的 MinerU 服务。

MinerU,PDF,人工智能,vLLM2025/12/30

VLLM Docker 容器化部署指南:在 NVIDIA Jetson 平台高效运行大语言模型推理服务

VLLM是一个高效的开源大语言模型(LLM)推理服务框架,通过创新的PagedAttention技术实现高吞吐量和低延迟的推理性能。本文介绍的`dustynv/vllm`镜像是针对NVIDIA Jetson平台优化的容器化版本,由[dustynv/jetson-containers](https://github.com/dustynv/jetson-containers)项目构建,专为边缘计算场景设计,支持在资源受限的嵌入式设备上部署高性能LLM推理服务。

Docker,VLLM2025/12/2

vllm-openai Docker 部署全手册

从个人开发者测试开源大模型,到企业搭建私有推理服务,vllm-openai 都是高效且低成本的选择。本教程将从核心概念讲起,逐步覆盖 Docker 环境准备、镜像拉取、多场景部署、结果验证及问题排查,无论你是初学者还是高级工程师,都能照着步骤完成部署。

Docker,vllm-openai2025/10/9

verl Docker 容器化部署手册

无论你是刚接触大模型工具的初学者,还是需要高效管理训练任务的高级工程师,本教程都将带你一步步完成 verlai/verl 镜像的 Docker 部署——从工具认知、环境搭建到多场景部署实践,每个步骤均配备完整命令与详细说明,确保照着做就能成。

Docker,verl2025/10/8
镜像拉取问题咨询请 提交工单。官方公众号:源码跳动。官方技术交流群:1072982923。轩辕镜像所有镜像均来源于原始仓库,本站不存储、不修改、不传播任何镜像内容。