MinerU的Docker镜像,封装了PDF转机器可读格式的完整功能,支持WebUI、API及GPU加速,快速部署解决环境问题。
收藏数: 2
下载次数: 9691
类型:

jianjungki/mineru!MinerU Logo
MinerU是一款专注于将PDF转换为机器可读格式(如markdown、JSON)的工具,诞生于InternLM的预训练过程,致力于解决科技文献中的符号转换问题。本Docker镜像封装了MinerU的完整运行环境,包含webui、API服务及vllm推理加速框架,可快速部署并解决环境兼容问题,确保在不同平台上提供一致的运行体验。
bashdocker run --rm -it -p 3000:3000 -p 7860:7860 --gpus=all jianjungki/mineru:latest
--rm:容器退出后自动清理-it:启用交互式终端-p 3000:3000 -p 7860:7860:映射服务端口(3000用于vllm-server,7860用于Gradio WebUI)--gpus=all:允许容器访问GPU(如需vllm加速)bash# 克隆仓库 git clone [***] cd MinerU # 构建镜像 docker build -t mineru:latest . # 启动容器 docker run -p 8001:8001 --env-file .env mineru:latest
--env-file .env:通过环境变量文件配置API密钥等参数-p 8001:8001:映射MCP-Server服务端口yamlversion: '3' services: mineru: image: jianjungki/mineru:latest ports: - "30000:30000" # vllm-server端口 - "7860:7860" # Gradio WebUI端口 - "8000:8000" # API服务端口 shm_size: "32g" ipc: host deploy: resources: reservations: devices: - driver: nvidia count: all capabilities: [gpu] command: /bin/bash
启动Web API服务:
bashdocker compose -f compose.yaml --profile api up -d
访问http://<server_ip>:8000/docs查看API文档
启动Gradio WebUI:
bashdocker compose -f compose.yaml --profile gradio up -d
访问http://<server_ip>:7860使用WebUI,http://<server_ip>:7860/?view=api调用Gradio API
启动vllm-server:
bashdocker compose -f compose.yaml --profile vllm-server up -d
通过客户端连接:mineru -p <input_path> -o <output_path> -b vlm-http-client -u http://<server_ip>:30000
通过环境变量或命令行参数配置服务,常用参数如下:
| 参数 | 描述 | 默认值 |
|---|---|---|
MINERU_API_BASE | MinerU远程API基础URL | [***] |
MINERU_API_KEY | 从官网申请的API密钥(远程调用时需配置) | - |
OUTPUT_DIR | 转换后文件保存路径 | /app/downloads |
--port | 服务端口(如vllm-server、API) | 30000(vllm)、8000(API) |
--enable-vllm-engine | 启用vllm推理引擎(Gradio服务) | false |
为保留转换结果,建议挂载输出目录:
bashdocker run -p 8001:8001 --env-file .env \ -v $(pwd)/downloads:/app/downloads \ jianjungki/mineru:latest
$(pwd)/downloads到容器/app/downloads,用于持久化存储转换后的文件以下是 jianjungki/mineru 相关的常用 Docker 镜像,适用于 不同场景 等不同场景:
您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 版本下载页面。


manifest unknown 错误
TLS 证书验证失败
DNS 解析超时
410 错误:版本过低
402 错误:流量耗尽
身份认证失败错误
429 限流错误
凭证保存错误
来自真实用户的反馈,见证轩辕镜像的优质服务