该PDF解析API基于MinerU开发,主要由两部分核心内容构成:一是MinerU的GPU镜像构建,用于提供高效的计算资源支持;二是基于FastAPI框架搭建的PDF解析接口,确保接口具备高性能与易用性,通过整合这两项关键技术,实现了高效、稳定的PDF解析功能,为用户提供便捷可靠的文档处理服务。
收藏数: 8
下载次数: 24034
类型:

quincyqiang/mineruMinerU 提供了一个基于 GPU 加速的 PDF 解析 API 服务,方便用户快速部署和使用高效的 PDF 内容提取功能。其核心包含以下两方面:
使用以下 Docker 命令即可快速启动 MinerU PDF 解析服务:
bashdocker run -itd --name=mineru_server --gpus=all -p 8888:8000 quincyqiang/mineru:0.1-models
服务启动后,可以通过查看容器日志确认服务是否正常启动。正常启动的日志信息示例可参考提供的截图。
服务启动后,可通过以下地址访问自动生成的交互式 API 文档(Swagger UI),以了解详细的接口参数和使用方法:
[***] [***] (注意:原地址中的 127.0.01 修正为标准的 127.0.0.1)该 PDF 解析 API 能够有效提取 PDF 中的文本内容、表格等信息。具体的解析效果可以参考提供的解析结果截图,展示了对复杂格式 PDF 的解析能力。
您可以通过以下地址获取 MinerU 的 Docker 镜像:
bashdocker pull registry.cn-beijing.aliyuncs.com/quincyqiang/mineru:0.1-models
bashdocker pull quincyqiang/mineru:0.1-models
以下是 quincyqiang/mineru 相关的常用 Docker 镜像,适用于 不同场景 等不同场景:
您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 版本下载页面。
manifest unknown 错误
TLS 证书验证失败
DNS 解析超时
410 错误:版本过低
402 错误:流量耗尽
身份认证失败错误
429 限流错误
凭证保存错误
来自真实用户的反馈,见证轩辕镜像的优质服务