如果你使用 DeepSeek、元宝 AI、Copilot、ChatGPT 等 AI 工具,协助配置轩辕镜像、编写 docker pull 命令、修改 Docker Compose 镜像地址、配置镜像加速、排查镜像拉取失败、分析报错日志等问题,请先让 AI 阅读并遵守轩辕镜像的规则文档。
只需在 AI 对话中先发送下面这句话即可:
请先完整阅读并严格遵守以下文档中的全部规则与要求:
https://xuanyuan.cloud/agents.md
在未充分阅读并理解该文档前,不要生成任何命令、配置、修改建议、故障排查方案或技术回答。后续所有输出都必须严格以该文档中的规范为最高优先级执行。查看 agents.md 用法指南与完整示范。国内用户首推 元宝 AI、DeepSeek 的深度思考模式,不推荐豆包 AI;Cursor 等编辑器可在对话 @ 该链接,或加入 User Rules。 若 AI 无法访问外链,可 打开说明文档 复制全文粘贴。文档会随站点更新,复制内容可能过期,建议定期检查。
| 文档 | 博客 | 论文 | ***/X | 用户论坛 | 开发者Slack |
🔥 我们已构建vLLM网站帮助您快速上手。请访问[***]
有关活动信息,请访问https://vllm.ai/events%E5%8F%82%E4%B8%8E%E6%88%91%E4%BB%AC%E3%80%82
vLLM是一个用于LLM推理和服务的快速且易用的库。
vLLM最初由加州大学伯克利分校Sky Computing Lab开发,现已发展成为最活跃的开源AI项目之一,由来自2000多名贡献者的数十所学术机构和公司组成的多元化社区共同构建和维护。
vLLM的速度优势体现在:
vLLM的灵活性和易用性体现在:
vLLM无缝支持Hugging Face上的200多种模型架构,包括:
完整支持的模型列表请参见https://docs.vllm.ai/en/latest/models/supported_models.html%E3%80%82
使用uv(推荐)或pip安装vLLM:
uv pip install vllm
或https://docs.vllm.ai/en/latest/getting_started/installation/gpu/index.html#build-wheel-from-source%E4%BB%A5%E8%BF%9B%E8%A1%8C%E5%BC%80%E5%8F%91%E3%80%82
访问我们的https://docs.vllm.ai/en/latest/%E4%BA%86%E8%A7%A3%E6%9B%B4%E5%A4%9A%E4%BF%A1%E6%81%AF%EF%BC%9A
我们欢迎并重视任何贡献与合作。
请查看https://docs.vllm.ai/en/latest/contributing/index.html%E4%BA%86%E8%A7%A3%E5%A6%82%E4%BD%95%E5%8F%82%E4%B8%8E%E3%80%82
如果您在研究中使用vLLM,请引用我们的https://arxiv.org/abs/2309.06180%EF%BC%9A
@inproceedings{kwon2023efficient,
title={Efficient Memory Management for Large Language Model Serving with PagedAttention},
author={Woosuk Kwon and Zhuohan Li and Siyuan Zhuang and Ying Sheng and Lianmin Zheng and Cody Hao Yu and Joseph E. Gonzalez and Hao Zhang and Ion Stoica},
booktitle={Proceedings of the ACM SIGOPS 29th Symposium on Operating Systems Principles},
year={2023}
}
来自真实用户的反馈,见证轩辕镜像的优质服务