
unze/ocrmypdf-watchdogocrmypdf-watchdog 是一个基于 jbarlow83/ocrmypdf 镜像构建的监控工具,通过添加文件监控功能,实现对指定文件夹的自动化OCR处理。它能够监控目标文件夹中新增的、符合自定义扩展名的文件,并自动调用 OCRMyPDF(或其他指定命令)将文件转换为PDF格式,同时支持配置文件备份路径和输出路径。
/in)中的新文件/bak)存储原始文件,输出路径(/out)存储转换后的PDF通过 docker-compose 快速部署,默认会创建 /in(输入)、/bak(备份)、/out(输出)三个卷:
bashdocker-compose up -d
yamlversion: '3' services: ocrmypdf-watchdog: image: ocrmypdf-watchdog volumes: - ./in:/in # 输入文件夹(监控此目录的新文件) - ./bak:/bak # 备份文件夹(存储原始文件) - ./out:/out # 输出文件夹(存储转换后的PDF) environment: - OCRMYPDF_EXTENSIONS=pdf,tiff,png # 监控的文件扩展名 - WATCHDOG_FREQUENCY=10 # 监控频率(秒) - OCRMYPDF_PARAMETER=--force-ocr # OCRMyPDF额外参数
支持通过以下环境变量自定义行为:
| 环境变量 | 说明 |
|---|---|
OCRMYPDF_IN | 输入文件夹路径(默认:/in) |
OCRMYPDF_BAK | 备份文件夹路径(默认:/bak) |
OCRMYPDF_OUT | 输出文件夹路径(默认:/out) |
OCRMYPDF_BINARY | OCR转换命令路径(默认:ocrmypdf,可指定自定义命令) |
OCRMYPDF_PARAMETER | OCR命令的额外参数(如--force-ocr强制OCR,多个参数用空格分隔) |
WATCHDOG_EXTENSIONS | 监控的文件扩展名(多个扩展名用逗号分隔,如pdf,tiff,png) |
WATCHDOG_FREQUENCY | 监控频率(秒,默认:5) |
除环境变量外,还可通过命令行参数覆盖默认配置:
| 参数 | 说明 |
|---|---|
--in <in-path> | 指定输入文件夹路径(覆盖 OCRMYPDF_IN) |
--bak <backup-path> | 指定备份文件夹路径(覆盖 OCRMYPDF_BAK) |
--out <out-path> | 指定输出文件夹路径(覆盖 OCRMYPDF_OUT) |
--frequency <seconds> | 指定监控频率(秒,覆盖 WATCHDOG_FREQUENCY) |
--ocrmypdf <path> | 指定OCR命令路径(覆盖 OCRMYPDF_BINARY) |
bashdocker run --rm -v ./in:/in -v ./out:/out ocrmypdf-watchdog \ --in /in \ --out /out \ --frequency 15 \ --ocrmypdf /usr/local/bin/ocrmypdf




manifest unknown 错误
TLS 证书验证失败
DNS 解析超时
410 错误:版本过低
402 错误:流量耗尽
身份认证失败错误
429 限流错误
凭证保存错误
来自真实用户的反馈,见证轩辕镜像的优质服务