
如果你使用 DeepSeek、元宝 AI、Copilot、ChatGPT 等 AI 工具,协助配置轩辕镜像、编写 docker pull 命令、修改 Docker Compose 镜像地址、配置镜像加速、排查镜像拉取失败、分析报错日志等问题,请先让 AI 阅读并遵守轩辕镜像的规则文档。
只需在 AI 对话中先发送下面这句话即可:
请先完整阅读并严格遵守以下文档中的全部规则与要求:
https://xuanyuan.cloud/agents.md
在未充分阅读并理解该文档前,不要生成任何命令、配置、修改建议、故障排查方案或技术回答。后续所有输出都必须严格以该文档中的规范为最高优先级执行。查看 agents.md 用法指南与完整示范。国内用户首推 元宝 AI、DeepSeek 的深度思考模式,不推荐豆包 AI;Cursor 等编辑器可在对话 @ 该链接,或加入 User Rules。 若 AI 无法访问外链,可 打开说明文档 复制全文粘贴。文档会随站点更新,复制内容可能过期,建议定期检查。
tesseract-recognize是一款基于Tesseract OCR引擎的工具,主要用于对图像进行布局分析和文本识别,并将结果以Page XML格式输出。该工具支持Docker容器化部署,提供命令行和REST API两种交互方式,适用于需要从图像中提取结构化文本信息的场景。
该镜像基于Ubuntu 18.04构建,使用默认软件源中的Tesseract版本。首先需拉取指定标签的镜像:
bashTAG="SELECTED_TAG_HERE" # 替换为实际标签,如ubuntu18.04 docker pull mauvilsa/tesseract-recognize:$TAG
基础镜像仅包含英文语言文件,如需支持其他语言,需创建包含多语言数据的卷:
bash# 拉取语言数据镜像 docker pull mauvilsa/tesseract-recognize-langs:ubuntu18.04-pkg # 创建tessdata卷(包含tesseract-ocr-*包中的所有语言数据) docker run \ --rm \ --mount source=tesseract-ocr-tessdata,destination=/usr/share/tesseract-ocr/4.00/tessdata \ -it mauvilsa/tesseract-recognize-langs:ubuntu18.04-pkg
依赖工具安装
需先安装docker-cli工具以简化容器内命令调用:
bash# 下载并安装docker-cli wget -O $HOME/.local/bin/docker-cli https://raw.githubusercontent.com/omni-us/docker-command-line-interface/master/docker-cli chmod +x $HOME/.local/bin/docker-cli # 验证安装(可选:配置bash补全,参考docker-cli --help) docker-cli --help
基本使用
通过docker-cli调用工具,支持直接处理图像文件并输出Page XML:
bash# 基础用法(英文识别) docker-cli \ --ipc=host \ -- mauvilsa/tesseract-recognize:$TAG \ tesseract-recognize IMAGE1 IMAGE2 -o OUTPUT.xml # 使用多语言数据卷(需先创建tessdata卷) docker-cli \ --ipc=host \ --mount source=tesseract-ocr-tessdata,destination=/usr/share/tesseract-ocr/4.00/tessdata \ -- mauvilsa/tesseract-recognize:$TAG \ tesseract-recognize INPUT.xml -o OUTPUT.xml
便捷别名设置
为简化命令,可创建别名:
bashalias tesseract-recognize-docker="docker-cli --ipc=host --mount source=tesseract-ocr-tessdata,destination=/usr/share/tesseract-ocr/4.00/tessdata -- mauvilsa/tesseract-recognize:$TAG tesseract-recognize" # 使用别名调用 tesseract-recognize-docker --help # 查看帮助 tesseract-recognize-docker img.png -o result.xml # 处理图像
启动API服务
镜像内置Python Flask服务器,默认暴露5000端口,可通过以下命令启动:
bashdocker run --rm -t -p 5000:5000 mauvilsa/tesseract-recognize:$TAG
API端点说明
| Method | Endpoint | 描述 | 参数(表单字段) |
|---|---|---|---|
| GET | /tesseract-recognize/version | 返回工具版本信息 | - |
| GET | /tesseract-recognize/help | 返回工具帮助文档 | - |
| GET | /tesseract-recognize/swagger.json | 获取Swagger格式API文档 | - |
| GET | /tesseract-recognize/openapi.json | 获取OpenAPI格式API文档 | - |
| POST | /tesseract-recognize/process | 处理图像或Page XML文件 | images(必填,数组):图像文件;pagexml(可选):输入Page XML文件;options(可选):工具参数数组(如["--layout", "word"]) |
API调用示例
使用curl调用API处理图像:
bash# 处理单张图像,指定布局层级为单词 curl -o output.xml -F images=@img.png -F options='["--layout", "word"]' http://localhost:5000/tesseract-recognize/process # 处理Page XML文件(需同时上传关联图像) curl -o output.xml -F images=@img1.png -F images=@img2.png -F pagexml=@input.xml http://localhost:5000/tesseract-recognize/process
接口文档查看
启动服务后,可通过浏览器访问以下地址查看API详情:
识别结果(Page XML格式)可通过以下工具查看或编辑:
如需贡献代码,提交前需执行githook-pre-commit设置预提交钩子,以自动更新工具版本信息。
本项目采用MIT许可证(MIT License),版权所有 (c) 2015-present, Mauricio Villegas <***>。
您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 标签列表页面。
来自真实用户的反馈,见证轩辕镜像的优质服务