轩辕镜像
轩辕镜像专业版
个人中心搜索镜像
交易
充值流量我的订单
工具
工单支持镜像收录Run 助手IP 归属地密码生成Npm 源Pip 源
帮助
常见问题我要吐槽
其他
关于我们网站地图

官方QQ群: 13763429

轩辕镜像
镜像详情
geimist/ocrmypdf-polyglot
官方博客使用教程热门镜像工单支持
本站面向开发者与科研用户,提供开源镜像的搜索和下载加速服务。
所有镜像均来源于原始开源仓库,本站不存储、不修改、不传播任何镜像内容。
轩辕镜像 - 国内开发者首选的专业 Docker 镜像下载加速服务平台 - 官方QQ群:13763429 👈点击免费获得技术支持。
本站面向开发者与科研用户,提供开源镜像的搜索和下载加速服务。所有镜像均来源于原始开源仓库,本站不存储、不修改、不传播任何镜像内容。

本站支持搜索的镜像仓库:Docker Hub、gcr.io、ghcr.io、quay.io、k8s.gcr.io、registry.gcr.io、elastic.co、mcr.microsoft.com

ocrmypdf-polyglot Docker 镜像下载 - 轩辕镜像

ocrmypdf-polyglot 镜像详细信息和使用指南

ocrmypdf-polyglot 镜像标签列表和版本信息

ocrmypdf-polyglot 镜像拉取命令和加速下载

ocrmypdf-polyglot 镜像使用说明和配置指南

Docker 镜像加速服务 - 轩辕镜像平台

国内开发者首选的 Docker 镜像加速平台

极速拉取 Docker 镜像服务

相关 Docker 镜像推荐

热门 Docker 镜像下载

ocrmypdf-polyglot
geimist/ocrmypdf-polyglot

ocrmypdf-polyglot 镜像详细信息

ocrmypdf-polyglot 镜像标签列表

ocrmypdf-polyglot 镜像使用说明

ocrmypdf-polyglot 镜像拉取命令

Docker 镜像加速服务

轩辕镜像平台优势

镜像下载指南

相关 Docker 镜像推荐

基于***jbarlow83/ocrmypdf x86_64镜像构建的OCRmyPDF,已预装tesseract-ocr-all以支持所有语言的PDF文字识别与转换
3 收藏0 次下载activegeimist镜像
🚀轩辕镜像专业版更稳定💎一键安装 Docker 配置镜像源
中文简介版本下载
🚀轩辕镜像专业版更稳定💎一键安装 Docker 配置镜像源

ocrmypdf-polyglot 镜像详细说明

ocrmypdf-polyglot 使用指南

ocrmypdf-polyglot 配置说明

ocrmypdf-polyglot 官方文档

OCRmyPDF 全语言支持镜像

镜像概述

本镜像基于***jbarlow83/ocrmypdf x86_64镜像构建,在保留原版OCRmyPDF核心功能的基础上,通过预装tesseract-ocr-all软件包,实现了对所有语言的PDF文件文字识别(OCR)与转换支持。可将扫描版PDF(图片PDF)转换为可搜索、可复制的文本层PDF,适用于多语言文档处理场景。

核心功能与特性

  • 完整继承*功能**:包含OCRmyPDF的全部原生能力,如PDF优化、文字层嵌入、文件压缩、分辨率调整等
  • 全语言支持:通过预装tesseract-ocr-all,支持Tesseract OCR引擎兼容的所有语言(包括中文、英文、日文、韩文、德文、法文等)
  • 架构兼容性:基于x86_64架构构建,适配主流64位Linux系统及容器运行环境
  • 即开即用:无需额外配置语言包,拉取镜像后可直接处理多语言PDF文件

使用场景

  • 多语言学术论文、报告的数字化归档(如包含中英日韩等多语言的文档)
  • 国际化企业的文档管理系统(需处理多语言合同、手册等扫描件)
  • 图书馆、档案馆的多语言文献数字化项目
  • 个人用户处理多语言扫描PDF(如跨国票据、多语言书籍章节等)

使用方法与配置说明

基本使用命令

通过docker run命令运行容器,挂载本地目录以访问待处理PDF文件:

docker run --rm -v /本地文件目录:/data [镜像名称] ocrmypdf [输入文件] [输出文件]

参数说明:

  • --rm:容器运行结束后自动删除,避免残留临时容器
  • -v /本地文件目录:/data:将本地存放PDF文件的目录挂载到容器内的/data目录,实现文件共享
  • [镜像名称]:实际使用的Docker镜像名称(需替换为具体镜像标签)
  • ocrmypdf [输入文件] [输出文件]:OCRmyPDF核心命令,指定容器内/data目录下的输入PDF和输出PDF路径

多语言识别示例

处理包含简体中文、英文和日文的扫描PDF:

docker run --rm -v /home/user/pdfs:/data my-ocr-image ocrmypdf --language chi_sim+eng+jpn input_scan.pdf output_ocr.pdf

关键参数:

  • --language chi_sim+eng+jpn:指定识别语言组合(chi_sim=简体中文,eng=英文,jpn=日文),可根据实际需求调整语言代码(完整语言代码列表见Tesseract***文档)

高级配置

可通过OCRmyPDF原生参数调整处理效果,如:

  • --dpi 300:设置扫描分辨率(默认300 DPI)
  • --compress jpeg:指定图片压缩方式
  • --output-type pdfa:输出PDF/A归档格式

示例(生成高分辨率PDF/A格式的多语言文档):

docker run --rm -v /home/user/pdfs:/data my-ocr-image ocrmypdf --language chi_sim+eng --dpi 400 --output-type pdfa input.pdf output_archive.pdf

注意事项

  • 确保本地挂载目录具有读写权限,避免容器因权限不足导致文件处理失败
  • 大型PDF文件(如超过100页)处理可能需要较多内存,建议根据实际情况通过--memory参数限制容器内存使用
  • 语言代码需严格遵循Tesseract标准(区分大小写),错误代码会导致识别失败
  • 输出文件默认保存在容器内/data目录,需通过挂载目录获取到本地系统
查看更多 ocrmypdf-polyglot 相关镜像 →
jbarlow83/ocrmypdf logo
jbarlow83/ocrmypdf
by jbarlow83
OCRmyPDF为扫描PDF文件添加OCR文本层,使其可搜索或复制粘贴,支持多语言识别、页面旋转校正、歪斜修复,默认生成符合PDF/A标准的文档,支持多核处理,优化图像大小。
661M+ pulls
上次更新:11 天前

常见问题

轩辕镜像免费版与专业版有什么区别?

免费版仅支持 Docker Hub 加速,不承诺可用性和速度;专业版支持更多镜像源,保证可用性和稳定速度,提供优先客服响应。

轩辕镜像免费版与专业版有分别支持哪些镜像?

免费版仅支持 docker.io;专业版支持 docker.io、gcr.io、ghcr.io、registry.k8s.io、nvcr.io、quay.io、mcr.microsoft.com、docker.elastic.co 等。

流量耗尽错误提示

当返回 402 Payment Required 错误时,表示流量已耗尽,需要充值流量包以恢复服务。

410 错误问题

通常由 Docker 版本过低导致,需要升级到 20.x 或更高版本以支持 V2 协议。

manifest unknown 错误

先检查 Docker 版本,版本过低则升级;版本正常则验证镜像信息是否正确。

镜像拉取成功后,如何去掉轩辕镜像域名前缀?

使用 docker tag 命令为镜像打上新标签,去掉域名前缀,使镜像名称更简洁。

查看全部问题→

轩辕镜像下载加速使用手册

探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式

🔐

登录方式进行 Docker 镜像下载加速教程

通过 Docker 登录方式配置轩辕镜像加速服务,包含7个详细步骤

🐧

Linux Docker 镜像下载加速教程

在 Linux 系统上配置轩辕镜像源,支持主流发行版

🖥️

Windows/Mac Docker 镜像下载加速教程

在 Docker Desktop 中配置轩辕镜像加速,适用于桌面系统

📦

Docker Compose 镜像下载加速教程

在 Docker Compose 中使用轩辕镜像加速,支持容器编排

📋

K8s containerd 镜像下载加速教程

在 k8s 中配置 containerd 使用轩辕镜像加速

🔧

宝塔面板 Docker 镜像下载加速教程

在宝塔面板中配置轩辕镜像加速,提升服务器管理效率

💾

群晖 NAS Docker 镜像下载加速教程

在 Synology 群晖NAS系统中配置轩辕镜像加速

🐂

飞牛fnOS Docker 镜像下载加速教程

在飞牛fnOS系统中配置轩辕镜像加速

📱

极空间 NAS Docker 镜像下载加速教程

在极空间NAS中配置轩辕镜像加速

⚡

爱快路由 ikuai Docker 镜像下载加速教程

在爱快ikuai系统中配置轩辕镜像加速

🔗

绿联 NAS Docker 镜像下载加速教程

在绿联NAS系统中配置轩辕镜像加速

🌐

威联通 NAS Docker 镜像下载加速教程

在威联通NAS系统中配置轩辕镜像加速

📦

Podman Docker 镜像下载加速教程

在 Podman 中配置轩辕镜像加速,支持多系统

📚

ghcr、Quay、nvcr、k8s、gcr 等仓库下载镜像加速教程

配置轩辕镜像加速9大主流镜像仓库,包含详细配置步骤

🚀

专属域名方式进行 Docker 镜像下载加速教程

无需登录即可使用轩辕镜像加速服务,更加便捷高效

需要其他帮助?请查看我们的 常见问题 或 官方QQ群: 13763429

商务:17300950906
|©2024-2025 源码跳动
商务合作电话:17300950906|Copyright © 2024-2025 杭州源码跳动科技有限公司. All rights reserved.