openeuler/vllm-cpuvLLM Ascend Docker镜像是由openEuler CloudNative SIG维护的官方镜像,基于openEuler构建,提供免费使用且无每用户速率限制。vLLM是一个快速易用的大型语言模型(LLM)推理与服务库,最初由加州大学伯克利分校Sky计算实验室开发,现已发展为社区驱动项目,融合学术界与工业界贡献。
vLLM具备以下核心优势:
更多技术细节可参考vLLM论文(SOSP 2023)及vLLM官方文档。
vLLM Docker镜像标签由vLLM版本和基础镜像版本组成,具体信息如下:
| 标签 | 当前版本信息 | 支持架构 |
|---|---|---|
| 0.6.3-oe2403lts | vLLM 0.6.3 基于 openEuler 24.03-LTS | amd64 |
| 0.8.3-oe2203sp4 | vLLM 0.8.3 基于 openEuler 22.03-LTS-SP4 | amd64, arm64 |
| 0.8.3-oe2403lts | vLLM 0.8.3 基于 openEuler 24.03-LTS | amd64, arm64 |
| 0.8.4-oe2203sp4 | vLLM 0.8.4 基于 openEuler 22.03-LTS-SP4 | amd64 |
| 0.8.4-oe2403lts | vLLM 0.8.4 基于 openEuler 24.03-LTS | amd64 |
| 0.8.5-oe2203sp4 | vLLM 0.8.5 基于 openEuler 22.03-LTS-SP4 | amd64, arm64 |
| 0.8.5-oe2403lts | vLLM 0.8.5 基于 openEuler 24.03-LTS | amd64, arm64 |
| 0.9.0-oe2203sp4 | vLLM 0.9.0 基于 openEuler 22.03-LTS-SP4 | amd64, arm64 |
| 0.9.0-oe2403lts | vLLM 0.9.0 基于 openEuler 24.03-LTS | amd64, arm64 |
| 0.9.1-oe2203sp4 | vLLM 0.9.1 基于 openEuler 22.03-LTS-SP4 | amd64, arm64 |
| 0.9.1-oe2403lts | vLLM 0.9.1 基于 openEuler 24.03-LTS | amd64, arm64 |
| 0.10.1-oe2203sp4 | vLLM 0.10.1 基于 openEuler 22.03-LTS-SP4 | amd64, arm64 |
| 0.10.1-oe2403lts | vLLM 0.10.1 基于 openEuler 24.03-LTS | amd64, arm64 |
适用于需要高性能LLM推理和服务部署的场景,包括但不限于:
支持的硬件架构:Intel/AMD x86(amd64)、ARM AArch64(arm64)。
确保已安装Docker环境,支持amd64或arm64架构。
bash# 启动vLLM容器,映射8000端口 docker run --rm --name vllm -p 8000:8000 -it --entrypoint bash openeuler/vllm-cpu:latest
可使用Modelscope镜像加速模型下载:
bashexport VLLM_USE_MODELSCOPE=true
安装vLLM后,可通过以下Python脚本进行离线批量推理(首次运行需3-5分钟下载模型,取决于网络速度):
pythonfrom vllm import LLM, SamplingParams prompts = [ "Hello, my name is", "The future of AI is", ] sampling_params = SamplingParams(temperature=0.8, top_p=0.95) # 模型下载(首次运行,10 MB/s速度下约3-5分钟) llm = LLM(model="Qwen/Qwen3-8B") outputs = llm.generate(prompts, sampling_params) # 输出结果 for output in outputs: prompt = output.prompt generated_text = output.outputs[0].text print(f"Prompt: {prompt!r}, Generated text: {generated_text!r}")
如有疑问或需使用特殊功能,请通过openeuler-docker-images仓库提交issue或Pull Request。
manifest unknown 错误
TLS 证书验证失败
DNS 解析超时
410 错误:版本过低
402 错误:流量耗尽
身份认证失败错误
429 限流错误
凭证保存错误
来自真实用户的反馈,见证轩辕镜像的优质服务