quay.io/unstructured-io/unstructured:latest Docker 镜像 |...

热门搜索:

quay.io

quay.iolinux/amd64latest大小: 9.89GB更新于 2025年8月24日

quay.io/unstructured-io/unstructured 是 Unstructured 公司发布的容器镜像，打包了其核心文档解析工具，方便开发者直接部署到容器环境中使用。这个工具的主要作用是把各种非结构化文档——像日常工作里常见的 PDF、Word、Excel、PPT，还有网页 HTML、邮件、甚至图片里的文字（通过 OCR）——转换成结构化数据，比如提取文本内容、表格信息、段落标题，还有文档的元数据（作者、创建时间等）。它支持的格式很全，除了常见办公文件，还能处理 Markdown、JSON、EPUB 等，连扫描版 PDF 里的图片文字也能识别。解析时会自动处理文档里的复杂格式，比如 PDF 里的多栏布局、嵌套表格，Word 里的批注和修订痕迹，不用手动调整就能输出规整的结构化数据，省了不少预处理功夫。实际用的时候也简单，部署容器后通过 API 调用就行，支持批量处理文件，也能对接云存储（AWS S3、Google Cloud Storage 等）直接读取文档。对企业来说，不管是做内容管理系统的文本抽取，还是给 AI 模型准备训练数据（比如从合同文档里提取条款，从研究报告里摘关键结论），或者搭建自动化办公流程（自动提取报销单里的金额、日期），这个工具都能派上用场。和本地安装工具比，容器镜像的好处是不用自己配依赖——解析不同格式文件通常要装一堆库，比如处理 PDF 需要 PyPDF2，OCR 要 Tesseract，容器直接把这些都打包好了，拉下来就能跑，适合快速集成到现有系统里。目前这个项目是开源的，社区会持续更新格式支持和解析精度，遇到问题还能在 GitHub 上提 issue 找解决方案。

quay.io/unstructured-io/unstructured:latest

拉取命令

专属域名未获取到

更多版本

轩辕镜像配置手册

Docker 配置

登录仓库拉取

专属域名拉取

K8s Containerd

K3s

Dev Containers

Podman

Singularity/Apptainer

其他仓库配置

Harbor 镜像源配置

Portainer 镜像源配置

Nexus 镜像源配置

系统配置

Linux

Windows/Mac

MacOS OrbStack

Docker Compose

NAS 设备

群晖

飞牛

绿联

威联通

极空间

网络设备

爱快路由

宝塔面板

镜像拉取常见问题

使用与功能问题

配置了专属域名后，docker search 为什么会报错？

Docker Hub 上有的镜像，为什么在轩辕镜像网站搜不到？

机器不能直连外网时，怎么用 docker save / load 迁镜像？

docker pull 拉插件报错（plugin v1+json）怎么办？

WSL 里 Docker 拉镜像特别慢，怎么排查和优化？

轩辕镜像安全吗？如何用 digest 校验镜像没被篡改？

第一次用轩辕镜像拉 Docker 镜像，要怎么登录和配置？

轩辕镜像合规吗？轩辕镜像的合规是怎么做的？

错误码与失败问题

docker pull 提示 manifest unknown 怎么办？

docker pull 提示 no matching manifest 怎么办？

镜像已拉取完成，却提示 invalid tar header 或 failed to register layer 怎么办？

Docker pull 时 HTTPS / TLS 证书验证失败怎么办？

Docker pull 时 DNS 解析超时或连不上仓库怎么办？

docker 无法连接轩辕镜像域名怎么办？

Docker 拉取出现 410 Gone 怎么办？

出现 402 或「流量用尽」提示怎么办？

Docker 拉取提示 UNAUTHORIZED（401）怎么办？

遇到 429 Too Many Requests（请求太频繁）怎么办？

docker login 提示 Cannot autolaunch D-Bus，还算登录成功吗？

为什么会出现「单层超过 20GB」或 413，无法加速拉取？

账号 / 计费 / 权限

轩辕镜像免费版和专业版有什么区别？

轩辕镜像支持哪些 Docker 镜像仓库？

镜像拉取失败还会不会扣流量？

麒麟 V10 / 统信 UOS 提示 KYSEC 权限不够怎么办？

如何在轩辕镜像申请开具发票？

怎么修改轩辕镜像的网站登录和仓库登录密码？

如何注销轩辕镜像账户？要注意什么？

配置与原理类

写了 registry-mirrors，为什么还是走官方或仍然报错？

怎么用 docker tag 去掉镜像名里的轩辕域名前缀？

如何拉取指定 CPU 架构的镜像（如 ARM64、AMD64）？

用轩辕镜像拉镜像时快时慢，常见原因有哪些？

用户好评