请使用alexsuntop/mineru,因为MinerU已切换至vLLM框架,以实现更高效的模型推理、更快的响应速度及更高的吞吐量,为用户提供更优质的使用体验,确保在处理各类任务时能够保持稳定性能与卓越效率,满足不同场景下的应用需求。
收藏数: 2
下载次数: 21083
状态: archived
发布者: alexsuntop
类型: 镜像
alexsuntop/mineru-sglangMinerU 是一款文档解析工具,其 SGLang 后端支持通过 Docker 快速部署。本文基于官方 Dockerfile 及 Docker Compose 配置,提供 SGLang 后端服务(含服务器、API、WebUI)的部署与使用说明。
注意:MinerU 2.5+ 版本已切换为 vLLM 后端,相关镜像可参考 alexsuntop/mineru。本文内容适用于基于 SGLang 后端的旧版本(如 2.2.2)。
以下是核心配置文件 docker-compose.yaml 的关键说明(完整配置见 源码仓库):
3.1 默认配置(x-default)
定义所有服务的通用基础配置:
unless-stopped(异常退出后自动重启)。/etc/localtime、/etc/timezone),确保容器内时间同步。3.2 通用服务配置(x***u-sglang)
所有 MinerU 服务的共享配置:
alexsuntop/mineru-sglang:2.2.2,可通过环境变量 MINERU_DOCKER_IMAGE 自定义。MINERU_MODEL_SOURCE: local(使用本地模型)。device_ids 调整)。memlock: -1),提升 GPU 通信效率(ipc: host)。3.3 服务详情
(1)SGLang 后端服务器(sglang-server)
MINERU_PORT_OVERRIDE_SGLANG 自定义)。mineru-sglang-server --host 0.0.0.0 --port 30000。--data-parallel-size 2(需调整 device_ids 包含多个 GPU)。--gpu-memory-utilization 0.5(单 GPU 显存不足时降低,如 0.4)。(2)文档解析 API(api)
MINERU_PORT_OVERRIDE_API 自定义)。mineru-api --host 0.0.0.0 --port 8000,支持与 sglang-server 相同的 GPU 配置参数。(3)Gradio WebUI(gradio)
MINERU_PORT_OVERRIDE_GRADIO 自定义)。--enable-vllm-engine true:启用 vllm 引擎加速推理。--enable-api false:可选,禁用 API 接口。--max-convert-pages 20:可选,限制文档转换页数。通过 Docker Compose 的 --profile 指定服务类型,后台启动:
bash# 启动 SGLang 后端服务器 docker compose --profile sglang-server up -d # 启动文档解析 API docker compose --profile api up -d # 启动 Gradio WebUI docker compose --profile gradio up -d
安装 MinerU 客户端并测试文档解析:
安装客户端:
bashpip install mineru
执行测试(需替换 demo.pdf 为实际文件路径):
bashmineru -p demo.pdf -o ./output -b vlm-sglang-client -u [***] ``` - `-p`:输入文档路径 - `-o`:输出目录 - `-b`:后端类型(`vlm-sglang-client`) - `-u`:sglang-server 地址(默认 `[***]
device_ids(GPU 设备)、data-parallel-size(多卡并行)及 gpu-memory-utilization(显存占用)。MINERU_PORT_OVERRIDE_SGLANG=30001)修改默认端口。--max-convert-pages 限制文档转换页数,避免资源过载。源码参考:compose-anything
以下是 alexsuntop/mineru-sglang 相关的常用 Docker 镜像,适用于 不同场景 等不同场景:
您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 版本下载页面。
探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式
通过 Docker 登录认证访问私有仓库
在 Linux 系统配置镜像服务
在 Docker Desktop 配置镜像
Docker Compose 项目配置
Kubernetes 集群配置 Containerd
K3s 轻量级 Kubernetes 镜像加速
在宝塔面板一键配置镜像
Synology 群晖 NAS 配置
飞牛 fnOS 系统配置镜像
极空间 NAS 系统配置服务
爱快 iKuai 路由系统配置
绿联 NAS 系统配置镜像
QNAP 威联通 NAS 配置
Podman 容器引擎配置
HPC 科学计算容器配置
ghcr、Quay、nvcr 等镜像仓库
无需登录使用专属域名
需要其他帮助?请查看我们的 常见问题Docker 镜像访问常见问题解答 或 提交工单
免费版仅支持 Docker Hub 访问,不承诺可用性和速度;专业版支持更多镜像源,保证可用性和稳定速度,提供优先客服响应。
专业版支持 docker.io、gcr.io、ghcr.io、registry.k8s.io、nvcr.io、quay.io、mcr.microsoft.com、docker.elastic.co 等;免费版仅支持 docker.io。
当返回 402 Payment Required 错误时,表示流量已耗尽,需要充值流量包以恢复服务。
通常由 Docker 版本过低导致,需要升级到 20.x 或更高版本以支持 V2 协议。
先检查 Docker 版本,版本过低则升级;版本正常则验证镜像信息是否正确。
使用 docker tag 命令为镜像打上新标签,去掉域名前缀,使镜像名称更简洁。
来自真实用户的反馈,见证轩辕镜像的优质服务