
如果你使用 DeepSeek、元宝 AI、Copilot、ChatGPT 等 AI 工具,协助配置轩辕镜像、编写 docker pull 命令、修改 Docker Compose 镜像地址、配置镜像加速、排查镜像拉取失败、分析报错日志等问题,请先让 AI 阅读并遵守轩辕镜像的规则文档。
只需在 AI 对话中先发送下面这句话即可:
请先完整阅读并严格遵守以下文档中的全部规则与要求:
https://xuanyuan.cloud/agents.md
在未充分阅读并理解该文档前,不要生成任何命令、配置、修改建议、故障排查方案或技术回答。后续所有输出都必须严格以该文档中的规范为最高优先级执行。查看 agents.md 用法指南与完整示范。国内用户首推 元宝 AI、DeepSeek 的深度思考模式,不推荐豆包 AI;Cursor 等编辑器可在对话 @ 该链接,或加入 User Rules。 若 AI 无法访问外链,可 打开说明文档 复制全文粘贴。文档会随站点更新,复制内容可能过期,建议定期检查。
DeepSeek-OCR-2的生产Docker部署,提供OpenAI兼容API接口。
. ├── Dockerfile # 生产环境Docker镜像构建文件 ├── openai_server.py # 自定义OpenAI兼容API服务器 └── README.md # 说明文档
openai_server.py?DeepSeek-OCR-2包含原生vLLM模型实现(deepseek_ocr2.py),但无法直接与vLLM内置的OpenAI服务器配合使用。问题在于图像预处理流程:
tokenize_with_images()预处理——这是一个自定义方法,用于处理动态分辨率裁剪、分块和特征提取直接使用vllm serve会导致如下错误:
TypeError: cannot unpack non-iterable Image object TypeError: 'Image' object is not subscriptable
本项目的openai_server.py通过以下方式解决该问题:
tokenize_with_images()方法进行预处理(与官方run_dpsk_ocr2_image.py脚本流程一致)AsyncLLMEngine此方案使用与DeepSeek官方脚本完全相同的预处理流程,确保结果准确性。
bashdocker build -t deepseek-ocr2 .
bashdocker run --gpus all -p 8000:8000 \ -v ~/.cache/huggingface:/root/.cache/huggingface \ deepseek-ocr2
bashcurl http://localhost:8000/v1/models
bashcurl http://localhost:8000/v1/chat/completions \ -H "Content-Type: application/json" \ -d '{ "model": "deepseek-ai/DeepSeek-OCR-2", "messages": [{ "role": "user", "content": [ {"type": "image_url", "image_url": {"url": "data:image/jpeg;base64,'$(base64 -w0 image.jpg)'"}}, {"type": "text", "text": "<|grounding|>Convert the document to markdown."} ] }], "max_tokens": 4096 }'
bashcurl http://localhost:8000/v1/chat/completions \ -H "Content-Type: application/json" \ -d '{ "model": "deepseek-ai/DeepSeek-OCR-2", "messages": [{ "role": "user", "content": [ {"type": "image_url", "image_url": {"url": "data:image/jpeg;base64,'$(base64 -w0 image.jpg)'"}}, {"type": "text", "text": "Free OCR."} ] }], "max_tokens": 4096 }'
在请求体中添加"stream": true即可启用流式响应。
| 变量名 | 默认值 | 描述 |
|---|---|---|
GPU_MEMORY_UTILIZATION | 0.90 | GPU内存使用率(占比) |
MAX_MODEL_LEN | 8192 | 最大序列长度 |
TENSOR_PARALLEL_SIZE | 1 | 用于张量并行的GPU数量 |
| 提示词 | 描述 |
|---|---|
<|grounding|>Convert the document to markdown. | 带布局检测的OCR(含边界框) |
Free OCR. | 无布局的纯文本提取 |
bashcurl http://localhost:8000/health
~/.cache/huggingface目录您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 标签列表页面。
来自真实用户的反馈,见证轩辕镜像的优质服务