
如果你使用 DeepSeek、元宝 AI、Copilot、ChatGPT 等 AI 工具,协助配置轩辕镜像、编写 docker pull 命令、修改 Docker Compose 镜像地址、配置镜像加速、排查镜像拉取失败、分析报错日志等问题,请先让 AI 阅读并遵守轩辕镜像的规则文档。
只需在 AI 对话中先发送下面这句话即可:
请先完整阅读并严格遵守以下文档中的全部规则与要求:
https://xuanyuan.cloud/agents.md
在未充分阅读并理解该文档前,不要生成任何命令、配置、修改建议、故障排查方案或技术回答。后续所有输出都必须严格以该文档中的规范为最高优先级执行。查看 agents.md 用法指南与完整示范。国内用户首推 元宝 AI、DeepSeek 的深度思考模式,不推荐豆包 AI;Cursor 等编辑器可在对话 @ 该链接,或加入 User Rules。 若 AI 无法访问外链,可 打开说明文档 复制全文粘贴。文档会随站点更新,复制内容可能过期,建议定期检查。
在CPU上使用vLLM提供OpenAI兼容LLM API的最小化设置,前端配备LiteLLM代理用于统一路由和SDK兼容性。vLLM暴露/v1/*端点以兼容OpenAI,LiteLLM通过api_base将调用转发到任何OpenAI兼容后端。
base_url和密钥即可与标准OpenAI客户端配合使用客户端 ↔ LiteLLM代理(端口4000) ↔ vLLM后端
config.yaml中定义的OpenAI兼容上游服务bash# 单独运行vLLM后端(此处未展示) # 使用配置运行LiteLLM docker run -it --rm -p 4000:4000 \ -v $HOME/litellm/config.yaml:/app/config.yaml:ro \ --add-host=host.docker.internal:host-gateway \ zulfifazhar/litellm:local \ --config /app/config.yaml --host 0.0.0.0 --port 4000
LiteLLM从config.yaml读取模型路由,并转发到api_base指定的OpenAI兼容服务器。
config.yaml示例配置:
yamlgeneral_settings: master_key: sk-local-test model_list: - model_name: Qwen/Qwen2.5-coder-1.5B-Instruct litellm_params: model: hosted_vllm/Qwen/Qwen2.5-coder-1.5B-Instruct api_base: http://host.docker.internal:9000/v1 - model_name: Qwen/Qwen3-Embedding-0.6B litellm_params: model: hosted_vllm/Qwen/Qwen3-Embedding-0.6B api_base: http://host.docker.internal:9001/v1
LiteLLM支持使用api_base路由到OpenAI兼容上游服务,URL需包含/v1。
yamlversion: "3.8" services: litellm: image: zulfifazhar/litellm:local command: ["--config","/app/config.yaml","--host","0.0.0.0","--port","4000"] ports: ["4000:4000"] volumes: - /home/<username>/litellm/config.yaml:/app/config.yaml:ro extra_hosts: - "host.docker.internal:host-gateway" restart: unless-stopped
bashcurl http://localhost:4000/v1/models curl -s http://localhost:4000/v1/chat/completions \ -H "Authorization: Bearer sk-local-test" -H "Content-Type: application/json" \ -d '{"model":"Qwen/Qwen2.5-coder-1.5B-Instruct","messages":[{"role":"user","content":"ping"}]}' curl -s http://localhost:4000/v1/embeddings \ -H "Authorization: Bearer sk-local-test" -H "Content-Type: application/json" \ -d '{"model":"Qwen/Qwen3-Embedding-0.6B","input":["雅加达是印度尼西亚的首都。"]}'
LiteLLM和vLLM的端点均与OpenAI兼容。
您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 标签列表页面。
来自真实用户的反馈,见证轩辕镜像的优质服务
以下是 zulfifazhar/litellm 相关的常用 Docker 镜像,适用于 不同场景 等不同场景: