quay.io/openeuler/vllm-ascend:latest 镜像详情 - 轩辕镜像

quay.io

quay.iolinux/amd64latest大小: 15.05GB更新于 2025年8月24日

quay.io/openeuler/vllm-ascend 是由欧拉（openEuler）社区维护的容器镜像，专为昇腾（Ascend）AI芯片环境设计，基于高性能大语言模型（LLM）推理框架 vllm 构建。该镜像旨在为企业级 LLM 部署提供便捷、高效的解决方案，尤其适配昇腾芯片的算力特性与欧拉操作系统的稳定性。

核心功能

作为面向昇腾平台的专用推理镜像，其核心价值在于实现 LLM 的低延迟、高吞吐量推理服务。镜像内置经过优化的 vllm 框架，支持主流开源模型（如 Llama、ChatGLM、Qwen 等）的加载与运行，可直接对接企业常见的模型部署需求。通过容器化封装，用户无需手动配置昇腾驱动、CANN 工具链及 vllm 依赖，拉取镜像后即可快速启动推理服务，大幅降低技术门槛。

技术特点

镜像的核心优势在于深度适配昇腾芯片架构：

硬件协同优化：基于昇腾 CANN 异构计算架构，对 vllm 核心算子（如 Attention、FeedForward）进行针对性调优，充分发挥昇腾 AI 处理器的计算单元性能，相比通用环境推理效率提升 30% 以上；
内存效率提升：集成 vllm 经典的 PagedAttention 技术，并结合昇腾内存管理机制优化 KV 缓存分配，支持更大 batch size 推理，同等硬件条件下吞吐量提升 2-3 倍；
动态调度支持：适配昇腾多卡环境，支持模型并行与张量并行部署，同时保留 vllm 的动态批处理能力，可根据输入请求自动调整计算资源，平衡延迟与吞吐量。

适用场景

该镜像适用于需在昇腾平台部署 LLM 推理服务的场景，例如：

企业智能客服系统：支持高并发用户提问的实时响应；
内容生成工具：为文案创作、代码辅助等场景提供低延迟文本生成；
内部知识库问答：基于企业私有数据构建专属 LLM 服务，保障数据安全。

部署价值

依托欧拉操作系统的稳定性与昇腾芯片的算力优势，该镜像实现了“开箱即用”的 LLM 部署体验。企业无需关注底层硬件适配细节，通过容器化部署可快速将 LLM 能力集成到业务系统，同时借助欧拉社区的持续维护，确保镜像与昇腾软硬件生态的兼容性，为长期运行提供可靠支持。

quay.io/openeuler/vllm-ascend:latest

核心功能

技术特点

适用场景

部署价值

拉取命令

专属域名未获取到

相关镜像

轩辕镜像配置手册

Docker 配置

登录仓库拉取

专属域名拉取

K8s Containerd

K3s

Dev Containers

Podman

Singularity/Apptainer

其他仓库配置

系统配置

Linux

Windows/Mac

MacOS OrbStack

Docker Compose

NAS 设备

群晖

飞牛

绿联

威联通

极空间

网络设备

爱快路由

宝塔面板

镜像拉取常见问题

使用与功能问题

docker search 报错：专属域名下仅支持 Docker Hub 查询

网页搜不到镜像：Docker Hub 有但轩辕镜像搜索无结果

离线传输镜像：无法直连时用 docker save/load 迁移

Docker 插件安装错误：application/vnd.docker.plugin.v1+json

WSL 下 Docker 拉取慢：网络与挂载目录影响及优化

轩辕镜像是否安全？镜像完整性校验（digest）说明

如何用轩辕镜像拉取镜像？登录方式与专属域名配置

错误码与失败问题

manifest unknown 错误：镜像不存在或标签错误

TLS/SSL 证书验证失败：Docker pull 时 HTTPS 证书错误

DNS 解析超时：无法解析镜像仓库地址或连接超时

410 Gone 错误：Docker 版本过低导致协议不兼容

402 Payment Required 错误：流量耗尽错误提示

401 UNAUTHORIZED 错误：身份认证失败或登录信息错误

429 Too Many Requests 错误：请求频率超出专业版限制

Docker login 凭证保存错误：Cannot autolaunch D-Bus（不影响登录）

账号 / 计费 / 权限

免费版与专业版区别：功能、限额与使用场景对比

支持的镜像仓库：Docker Hub、GCR、GHCR、K8s 等列表

拉取失败是否扣流量？计费规则说明

KYSEC 权限不够：麒麟 V10/统信 UOS 下脚本执行被拦截

如何申请开具发票？（增值税普票/专票）

如何修改网站与仓库登录密码？

配置与原理类

registry-mirrors 未生效：仍访问官方仓库或报错的原因

如何去掉镜像名称中的轩辕域名前缀？（docker tag）

如何拉取指定架构镜像？（ARM64/AMD64 等多架构）

用户好评