apache/tika本镜像由 Apache Tika 开发团队维护,提供便捷的 Apache Tika Server 容器化部署方案。基于 Ubuntu 系统构建,内置对应版本的 Java 运行环境,可快速启动 Tika Server 实例,实现文档内容提取、格式解析等功能。镜像分为两个版本:
通过 Docker Hub 拉取指定版本镜像:
bashdocker pull apache/tika:<version>
<version>:Tika Server 版本号,格式为 x.y.z(基础版)或 x.y.z-full(完整版),例如 2.5.0 或 2.5.0-fullbashdocker run -d -p 127.0.0.1:9998:9998 apache/tika:<version>
-d:后台运行容器-p 127.0.0.1:9998:9998:将容器内 9998 端口映射到宿主机的 127.0.0.1:9998(仅本地访问)若确认容器运行在隔离网络中,可移除 127.0.0.1 绑定,允许外部访问:
bashdocker run -d -p 9998:9998 apache/tika:<version>
创建 docker-compose.yml:
yamlversion: '3' services: tika-server: image: apache/tika:2.5.0-full # 使用完整版示例 ports: - "127.0.0.1:9998:9998" # 仅本地访问 restart: unless-stopped # 容器退出时自动重启(非必要)
启动服务:
bashdocker-compose up -d
从源码构建镜像:
bashdocker build -t 'apache/tika' github.com/apache/tika-docker
构建后运行:
bashdocker run -d -p 127.0.0.1:9998:9998 apache/tika
完整版默认预装 5 种语言包,如需添加其他语言:
apt-get 命令,添加目标语言包(如日语包 tesseract-ocr-jpn)ADD 命令添加自定义语言包文件127.0.0.1,避免 Docker 调整 iptables 后将 Tika Server 暴露至公网2.5.0.1 及后续版本的详细变更,参见 CHANGES.md
GitHub 贡献者列表:tika-docker 贡献者,包括 @grossws、@arjunyel、@mpdude、@laszlocsontosuw、@tballison 等
本 Docker 镜像下载并使用 Apache Tika 团队在 Apache 软件基金会分发站点发布的二进制 JAR,但根据 Apache 发布政策,仅源代码发布为官方正式 artefact。详情参见 Apache 发布分发政策。

manifest unknown 错误
TLS 证书验证失败
DNS 解析超时
410 错误:版本过低
402 错误:流量耗尽
身份认证失败错误
429 限流错误
凭证保存错误
来自真实用户的反馈,见证轩辕镜像的优质服务