
如果你使用 DeepSeek、元宝 AI、Copilot、ChatGPT 等 AI 工具,协助配置轩辕镜像、编写 docker pull 命令、修改 Docker Compose 镜像地址、配置镜像加速、排查镜像拉取失败、分析报错日志等问题,请先让 AI 阅读并遵守轩辕镜像的规则文档。
只需在 AI 对话中先发送下面这句话即可:
请先完整阅读并严格遵守以下文档中的全部规则与要求:
https://xuanyuan.cloud/agents.md
在未充分阅读并理解该文档前,不要生成任何命令、配置、修改建议、故障排查方案或技术回答。后续所有输出都必须严格以该文档中的规范为最高优先级执行。查看 agents.md 用法指南与完整示范。国内用户首推 元宝 AI、DeepSeek 的深度思考模式,不推荐豆包 AI;Cursor 等编辑器可在对话 @ 该链接,或加入 User Rules。 若 AI 无法访问外链,可 打开说明文档 复制全文粘贴。文档会随站点更新,复制内容可能过期,建议定期检查。
基于vllm最新源码构建的Docker镜像:dengcao/vllm-openai:latest,已在NVIDIA RTX3060环境测试通过,运行稳定,可直接用于部署Qwen3系列模型。
当前镜像支持以下模型(模型文件可从ModelScope获取):
创建docker-compose.yaml文件,内容如下(以部署Qwen3-Reranker-0.6B为例,其他模型需调整对应参数):
yamlservices: Qwen3-Reranker-0.6B: container_name: Qwen3-Reranker-0.6B restart: no image: docker.xuanyuan.run/dengcao/vllm-openai:v0.9.2-dev # 基于vllm开发版构建,测试可用 ipc: host volumes: - ./models:/models # 宿主机模型目录挂载到容器内/models(需提前将模型文件放入宿主机./models目录) command: ['--model', '/models/Qwen3-Reranker-0.6B', '--served-model-name', 'Qwen3-Reranker-0.6B', '--gpu-memory-utilization', '0.90', '--hf_overrides', '{"architectures": ["Qwen3ForSequenceClassification"],"classifier_from_token": ["no", "yes"],"is_original_qwen3_reranker": true}'] ports: - 8010:8000 # 宿主机端口:容器内端口(容器内默认8000) deploy: resources: reservations: devices: - driver: nvidia count: all capabilities: [gpu]
将上述文件保存到本地后,在文件所在目录执行以下命令启动服务:
bashdocker compose up -d
NOT_NEED)Qwen3-Reranker-0.6B(需与部署时--served-model-name参数一致)NOT_NEED)Qwen3-Reranker-0.6B(同上)上述部署及调用流程已在FastGPT平台验证,可正常实现文本排序功能。
您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 标签列表页面。
来自真实用户的反馈,见证轩辕镜像的优质服务
以下是 dengcao/vllm-openai 相关的常用 Docker 镜像,适用于 不同场景 等不同场景: