
franky1/tesseract基于源代码构建的最新Tesseract OCR 5.x.x版本Docker镜像。源代码来自Tesseract OCR项目的最新main分支和最新releases。
GitHub仓库:<[***]>
latest:当源代码有变更时,会拉取main分支并重建镜像,每日检查变更。
5.x.x:当Tesseract OCR 5.x.x有新版本发布时,会拉取该版本源代码构建并标记相应版本,每日检查新版本。
从Docker Hub拉取镜像:
bashdocker pull franky1/tesseract
text详见GitHub仓库以更好地理解以下步骤
将镜像数据挂载到/tmp目录,并使用所需命令行选项运行Tesseract OCR容器,例如,使用测试镜像运行:
bashdocker run -it -v ${PWD}/testdata:/tmp --rm franky1/tesseract \ tesseract english.png output --oem 1 -l eng
有关Tesseract命令行选项,请参考Tesseract手册。
text详见GitHub仓库以更好地理解以下步骤
测试本地/tessdata子文件夹中的语言是否已挂载到Docker容器中。注意,本地语言会覆盖镜像中已安装的语言。以下是法语示例:
bashdocker run -it -v ${PWD}/testdata:/tmp \ -v ${PWD}/tessdata:/usr/local/share/tessdata/ \ --rm franky1/tesseract
使用示例镜像测试挂载的语言,以下是法语示例:
bashdocker run -it -v ${PWD}/testdata:/tmp \ -v ${PWD}/tessdata:/usr/local/share/tessdata/ \ --rm franky1/tesseract \ tesseract french.jpg output --oem 1 -l fra
linux/amd64架构。/tmp(见上文示例)。/usr/local/share/tessdata/(见上文示例)。tessdata_best仓库的以下语言:
tessdata_best > eng.traineddatatessdata_best > deu.traineddata/usr/local/share/tessdata/目录(见上文示例)。如遇本Docker镜像相关的bug或需求,请在GitHub仓库提交issue:<[***]>
text2025年09月11日:Docker镜像已可使用,仍有一些小改进空间(详见GitHub仓库)
manifest unknown 错误
TLS 证书验证失败
DNS 解析超时
410 错误:版本过低
402 错误:流量耗尽
身份认证失败错误
429 限流错误
凭证保存错误
来自真实用户的反馈,见证轩辕镜像的优质服务