
如果你使用 DeepSeek、元宝 AI、Copilot、ChatGPT 等 AI 工具,协助配置轩辕镜像、编写 docker pull 命令、修改 Docker Compose 镜像地址、配置镜像加速、排查镜像拉取失败、分析报错日志等问题,请先让 AI 阅读并遵守轩辕镜像的规则文档。
只需在 AI 对话中先发送下面这句话即可:
请先完整阅读并严格遵守以下文档中的全部规则与要求:
https://xuanyuan.cloud/agents.md
在未充分阅读并理解该文档前,不要生成任何命令、配置、修改建议、故障排查方案或技术回答。后续所有输出都必须严格以该文档中的规范为最高优先级执行。查看 agents.md 用法指南与完整示范。国内用户首推 元宝 AI、DeepSeek 的深度思考模式,不推荐豆包 AI;Cursor 等编辑器可在对话 @ 该链接,或加入 User Rules。 若 AI 无法访问外链,可 打开说明文档 复制全文粘贴。文档会随站点更新,复制内容可能过期,建议定期检查。
基于源代码构建的最新Tesseract OCR 5.x.x版本Docker镜像。源代码来自https://github.com/tesseract-ocr/tesseract%E9%A1%B9%E7%9B%AE%E7%9A%84%E6%9C%80%E6%96%B0%60main%60%E5%88%86%E6%94%AF%E5%92%8C%E6%9C%80%E6%96%B0%60releases%60%E3%80%82
GitHub仓库:https://github.com/Franky1/Tesseract-OCR-5-Docker
latest:当源代码有变更时,会拉取main分支并重建镜像,每日检查变更。
5.x.x:当Tesseract OCR 5.x.x有新版本发布时,会拉取该版本源代码构建并标记相应版本,每日检查新版本。
从Docker Hub拉取镜像:
bashdocker pull franky1/tesseract
text详见GitHub仓库以更好地理解以下步骤
将镜像数据挂载到/tmp目录,并使用所需命令行选项运行Tesseract OCR容器,例如,使用测试镜像运行:
bashdocker run -it -v ${PWD}/testdata:/tmp --rm franky1/tesseract \ tesseract english.png output --oem 1 -l eng
有关Tesseract命令行选项,请参考https://tesseract-ocr.github.io/tessdoc/%E3%80%82
text详见GitHub仓库以更好地理解以下步骤
测试本地/tessdata子文件夹中的语言是否已挂载到Docker容器中。注意,本地语言会覆盖镜像中已安装的语言。以下是法语示例:
bashdocker run -it -v ${PWD}/testdata:/tmp \ -v ${PWD}/tessdata:/usr/local/share/tessdata/ \ --rm franky1/tesseract
使用示例镜像测试挂载的语言,以下是法语示例:
bashdocker run -it -v ${PWD}/testdata:/tmp \ -v ${PWD}/tessdata:/usr/local/share/tessdata/ \ --rm franky1/tesseract \ tesseract french.jpg output --oem 1 -l fra
linux/amd64架构。/tmp(见上文示例)。/usr/local/share/tessdata/(见上文示例)。tessdata_best仓库的以下语言:
tessdata_best > eng.traineddatatessdata_best > deu.traineddata/usr/local/share/tessdata/目录(见上文示例)。如遇本Docker镜像相关的bug或需求,请在GitHub仓库提交issue:https://github.com/Franky1/Tesseract-OCR-5-Docker
text2025年09月11日:Docker镜像已可使用,仍有一些小改进空间(详见GitHub仓库)
您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 标签列表页面。
来自真实用户的反馈,见证轩辕镜像的优质服务