quay.io/unstructured-io/base-images 是数据处理工具开发商 Unstructured.io 推出的一系列基础容器镜像,托管在 Red Hat 旗下的容器仓库 quay.io 上。它们就像数据处理应用的“预制地基”,帮开发者跳过繁琐的环境配置,直接搭建处理文档、图片、表格等非结构化数据的应用框架。 这些镜像里提前装好的数据处理“工具箱”很实用:Python 运行环境、解析 PDF 和 Word 文档的 PyPDF2、python-docx 库,识别图片文字的 Tesseract OCR 工具,提取表格的 Camelot 组件,还有基础系统工具和安全补丁。硬件兼容性也不错,amd64 和 arm64 架构都支持,不管是 x86 服务器还是 ARM 开发板,拉下来就能用。镜像体积做了精简,核心功能保留的同时,尽量缩小占用空间,部署起来很快。 实际用的时候,企业搭文档自动解析系统、建非结构化数据抽取管道,或者做 AI 训练数据预处理,都能拿它当基础。比如要开发一个自动提取合同里关键信息的服务,直接基于这些镜像构建,不用自己装各种依赖库;处理大量 PDF 里的表格数据时,镜像里的工具链能直接上手,省去调试环境的时间。 比起自己从零配环境,这些镜像的好处挺实在:省时间,预装的依赖覆盖了大部分数据处理场景,不用一个个试错安装;环境统一,团队里不管谁用,基础镜像一样,能少踩“本地跑正常、部署就出错”的坑;还能无缝对接 Unstructured.io 的其他工具,像数据导入工具 unstructured-ingest、API 服务框架 unstructured-api,基于镜像扩展一下就能跑起来。作为开源项目的一部分,它们文档全,社区会定期更新维护,安全漏洞修复也及时,用着更省心。
请登录使用轩辕镜像享受快速拉取体验,支持国内访问优化,速度提升
docker pull quay.io/unstructured-io/base-images:rocky9.2-9探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式
通过 Docker 登录认证访问私有仓库
无需登录使用专属域名
Kubernetes 集群配置 Containerd
K3s 轻量级 Kubernetes 镜像加速
VS Code Dev Containers 配置
Podman 容器引擎配置
HPC 科学计算容器配置
ghcr、Quay、nvcr 等镜像仓库
Harbor Proxy Repository 对接专属域名
Portainer Registries 加速拉取
Nexus3 Docker Proxy 内网缓存
需要其他帮助?请查看我们的 常见问题Docker 镜像访问常见问题解答 或 提交工单
manifest unknown
no matching manifest(架构)
invalid tar header(解压)
TLS 证书失败
DNS 超时
410 Gone 排查
402 与流量用尽
401 认证失败
429 限流
D-Bus 凭证提示
413 与超大单层
来自真实用户的反馈,见证轩辕镜像的优质服务