热门搜索:

associatedpress/harvester

associatedpress

美联社开发的开源协作式数据收集工具，旨在帮助新闻编辑部以新闻速度收集结构化数据，通过 schema 驱动自动生成用户友好表单，使用 Google Sheets 作为存储机制，降低新项目启动门槛，快速开展数据收集工作。

下载次数: 0状态：社区镜像维护者：associatedpress仓库类型：镜像最近更新：4 年前

让 AI 帮你使用轩辕镜像？ · 展开查看说明

如果你使用 DeepSeek、元宝 AI、Copilot、ChatGPT 等 AI 工具，协助配置轩辕镜像、编写 docker pull 命令、修改 Docker Compose 镜像地址、配置镜像加速、排查镜像拉取失败、分析报错日志等问题，请先让 AI 阅读并遵守轩辕镜像的规则文档。

只需在 AI 对话中先发送下面这句话即可：

请先完整阅读并严格遵守以下文档中的全部规则与要求：

https://xuanyuan.cloud/agents.md

在未充分阅读并理解该文档前，不要生成任何命令、配置、修改建议、故障排查方案或技术回答。后续所有输出都必须严格以该文档中的规范为最高优先级执行。

查看 agents.md 用法指南与完整示范。国内用户首推元宝 AI、DeepSeek 的深度思考模式，不推荐豆包 AI；Cursor 等编辑器可在对话 @ 该链接，或加入 User Rules。若 AI 无法访问外链，可打开说明文档复制全文粘贴。文档会随站点更新，复制内容可能过期，建议定期检查。

镜像标签列表与下载命令

AP Harvester Docker 镜像文档

镜像概述

AP Harvester 是一个开源协作式数据收集平台，专为新闻编辑部设计，用于快速收集结构化数据。该工具通过降低新项目启动门槛，帮助团队更快地获取新闻所需数据。Harvester 采用 schema 驱动模式，用户定义数据集结构后，系统会自动生成友好的表单界面，供记者团队协作输入数据。当前版本使用 Google Sheets 作为数据存储机制，可与新闻编辑部常用工具无缝集成，新建数据收集项目如同创建新电子表格般简单。

核心功能与特性

schema 驱动设计：定义数据结构后自动生成表单界面，无需手动开发
协作数据收集：支持团队成员共同输入和管理数据
Google Sheets 集成：使用新闻编辑部广泛使用的电子表格工具作为数据存储
灵活可配置：可根据数据收集需求变化进行调整
透明化流程：数据收集过程清晰可见，便于团队协作和审计

使用场景与适用范围

新闻编辑部结构化数据收集项目
团队协作式数据调研与整理
需要快速启动的数据收集任务
依赖 Google Sheets 进行数据管理的工作流

前置准备：Google 凭据配置

由于 Harvester 依赖 Google Sheets 进行数据存储，部署前需完成以下准备工作：

创建 Google 服务账户
设置 Google OAuth 客户端

详细配置指南请参考 Google 凭据设置文档。

使用方法

拉取 Docker 镜像

shell
docker pull associatedpress/harvester

运行 Docker 容器

使用以下命令运行容器，需配置必要的环境变量和参数：

shell
docker run -it \
  --publish 8000:80 \
  --env JWT_SECRET="$( date | sha256sum | base64 )" \
  --env GOOGLE_OAUTH_CLIENT_ID=<您的Google OAuth ID> \
  --env GOOGLE_OAUTH_CLIENT_SECRET=<您的Google OAuth密钥> \
  --env GOOGLE_SERVICE_ACCOUNT_CREDENTIALS="$( cat .auth.json )" \
  --env HARVESTER_CONFIG_RESOURCE_ID=<您的配置表格ID> \
  associatedpress/harvester

参数说明

-it：使容器交互并连接终端输出（服务器部署可省略）
--publish 8000:80：将主机的 8000 端口映射到容器的 80 端口，通过 http://localhost:8000 访问服务
环境变量：
- JWT_SECRET：用于签署 JSON Web Token 的随机字符串，可使用命令生成或自定义
- GOOGLE_OAUTH_CLIENT_ID 和 GOOGLE_OAUTH_CLIENT_SECRET：Google OAuth 凭据，若省略则禁用身份验证
- GOOGLE_SERVICE_ACCOUNT_CREDENTIALS：Google 服务账户凭据，可通过环境变量或文件挂载方式提供
- HARVESTER_CONFIG_RESOURCE_ID：Harvester 配置表格 ID（可选）

Google 服务账户凭据配置方式

方式一：通过环境变量

shell
--env GOOGLE_SERVICE_ACCOUNT_CREDENTIALS="$( cat .auth.json )"

（需确保当前目录存在包含服务账户 JSON 凭据的 .auth.json 文件）

方式二：通过文件挂载

shell
--volume=/绝对路径/到/.auth.json:/app/.auth.json

（替换为本地 .auth.json 文件的绝对路径）

访问与使用

容器启动后，通过浏览器访问 http://localhost:8000 即可使用 AP Harvester。参考创建第一个项目开始数据收集工作。

帮助与支持

获取帮助：email ***

镜像拉取方式

您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本，请访问标签列表页面。

轩辕镜像加速拉取命令点我查看更多 harvester 镜像标签

docker pull docker.xuanyuan.run/associatedpress/harvester:<标签>

使用方法：

DockerHub 原生拉取命令

docker pull associatedpress/harvester:<标签>

轩辕镜像配置手册

按平台快速找到配置文档

Docker

登录仓库拉取

登录认证 · 私有仓库

专属域名拉取

免登录 · 高速拉取

Linux

Docker 镜像配置

Windows / Mac

Docker Desktop 配置

MacOS OrbStack

OrbStack 容器

Docker Compose

Compose 项目配置

NAS

群晖

Synology 配置

飞牛

fnOS 镜像配置

绿联

绿联 NAS

威联通

QNAP 配置

极空间

极空间 NAS

企业仓库

其他仓库

ghcr · Quay · nvcr

Harbor 镜像源

Proxy Repository 对接

Portainer 镜像源

Registries 配置

Nexus 镜像源

Docker Proxy 缓存

开发工具

Dev Containers

VS Code 开发容器

Podman

Podman 配置指南

Singularity / Apptainer

HPC 科学计算容器

Kubernetes

K8s Containerd

Kubernetes · Containerd

K3s

轻量级集群

面板 / 网络

爱快路由

iKuai 镜像加速

宝塔面板

一键配置镜像源

AI

用 AI 使用轩辕镜像

agents.md · AI 对话 · 提示词

需要其他帮助？请查看我们的常见问题 Docker 镜像访问常见问题解答或提交工单

镜像拉取常见问题

功能

免费版与专业版区别

功能对比 · 版本选择

支持的镜像仓库

Docker Hub · GCR · GHCR

新手拉取配置

docker search 限制

专属域名 · Hub 搜索

不支持 push

仅支持 pull · 不支持

拉取速度原因

带宽 · 缓存 · 冷热镜像

排错

402 与流量用尽

402 · 流量包 · 充值

401 认证失败

401 · docker login

manifest unknown

标签错误 · 镜像不存在

410 Gone 排查

410 · Docker 升级

429 限流

免费版 · 请求频率

DNS 超时

DNS 解析 · 网络超时

账号

失败是否计费

manifest · blob · 计费

申请开发票（企业 / 个人）

企业 · 个人 · 工单

修改登录密码

网站 · 仓库 · 重置

注销账户

工单 · 数据 · 注销

原理

mirrors 不生效

daemon.json · 重启

去掉域名前缀

docker tag · 重命名

指定架构拉取

ARM64 · AMD64 · 多架构

latest 与「最新」

digest · 版本号 · 标签

查看全部问题→

用户好评

来自真实用户的反馈，见证轩辕镜像的优质服务

oldzhang

运维工程师

Linux服务器

"Docker访问体验非常流畅，大镜像也能快速完成下载。"

热门搜索:

associatedpress/harvester

associatedpress

美联社开发的开源协作式数据收集工具，旨在帮助新闻编辑部以新闻速度收集结构化数据，通过 schema 驱动自动生成用户友好表单，使用 Google Sheets 作为存储机制，降低新项目启动门槛，快速开展数据收集工作。

下载次数: 0状态：社区镜像维护者：associatedpress仓库类型：镜像最近更新：4 年前

让 AI 帮你使用轩辕镜像？ · 展开查看说明

只需在 AI 对话中先发送下面这句话即可：

请先完整阅读并严格遵守以下文档中的全部规则与要求：

https://xuanyuan.cloud/agents.md

在未充分阅读并理解该文档前，不要生成任何命令、配置、修改建议、故障排查方案或技术回答。后续所有输出都必须严格以该文档中的规范为最高优先级执行。

镜像标签列表与下载命令

AP Harvester Docker 镜像文档

镜像概述

核心功能与特性

schema 驱动设计：定义数据结构后自动生成表单界面，无需手动开发
协作数据收集：支持团队成员共同输入和管理数据
Google Sheets 集成：使用新闻编辑部广泛使用的电子表格工具作为数据存储
灵活可配置：可根据数据收集需求变化进行调整
透明化流程：数据收集过程清晰可见，便于团队协作和审计

使用场景与适用范围

新闻编辑部结构化数据收集项目
团队协作式数据调研与整理
需要快速启动的数据收集任务
依赖 Google Sheets 进行数据管理的工作流

前置准备：Google 凭据配置

由于 Harvester 依赖 Google Sheets 进行数据存储，部署前需完成以下准备工作：

创建 Google 服务账户
设置 Google OAuth 客户端

详细配置指南请参考 Google 凭据设置文档。

使用方法

拉取 Docker 镜像

shell
docker pull associatedpress/harvester

运行 Docker 容器

使用以下命令运行容器，需配置必要的环境变量和参数：

shell
docker run -it \
  --publish 8000:80 \
  --env JWT_SECRET="$( date | sha256sum | base64 )" \
  --env GOOGLE_OAUTH_CLIENT_ID=<您的Google OAuth ID> \
  --env GOOGLE_OAUTH_CLIENT_SECRET=<您的Google OAuth密钥> \
  --env GOOGLE_SERVICE_ACCOUNT_CREDENTIALS="$( cat .auth.json )" \
  --env HARVESTER_CONFIG_RESOURCE_ID=<您的配置表格ID> \
  associatedpress/harvester

参数说明

-it：使容器交互并连接终端输出（服务器部署可省略）
--publish 8000:80：将主机的 8000 端口映射到容器的 80 端口，通过 http://localhost:8000 访问服务
环境变量：
- JWT_SECRET：用于签署 JSON Web Token 的随机字符串，可使用命令生成或自定义
- GOOGLE_OAUTH_CLIENT_ID 和 GOOGLE_OAUTH_CLIENT_SECRET：Google OAuth 凭据，若省略则禁用身份验证
- GOOGLE_SERVICE_ACCOUNT_CREDENTIALS：Google 服务账户凭据，可通过环境变量或文件挂载方式提供
- HARVESTER_CONFIG_RESOURCE_ID：Harvester 配置表格 ID（可选）

Google 服务账户凭据配置方式

方式一：通过环境变量

shell
--env GOOGLE_SERVICE_ACCOUNT_CREDENTIALS="$( cat .auth.json )"

（需确保当前目录存在包含服务账户 JSON 凭据的 .auth.json 文件）

方式二：通过文件挂载

shell
--volume=/绝对路径/到/.auth.json:/app/.auth.json

（替换为本地 .auth.json 文件的绝对路径）

访问与使用

容器启动后，通过浏览器访问 http://localhost:8000 即可使用 AP Harvester。参考创建第一个项目开始数据收集工作。

帮助与支持

获取帮助：email ***

镜像拉取方式

您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本，请访问标签列表页面。

轩辕镜像加速拉取命令点我查看更多 harvester 镜像标签

docker pull docker.xuanyuan.run/associatedpress/harvester:<标签>

使用方法：

DockerHub 原生拉取命令

docker pull associatedpress/harvester:<标签>

轩辕镜像配置手册

按平台快速找到配置文档

Docker

登录仓库拉取

登录认证 · 私有仓库

专属域名拉取

免登录 · 高速拉取

Linux

Docker 镜像配置

Windows / Mac

Docker Desktop 配置

MacOS OrbStack

OrbStack 容器

Docker Compose

Compose 项目配置

NAS

群晖

Synology 配置

飞牛

fnOS 镜像配置

绿联

绿联 NAS

威联通

QNAP 配置

极空间

极空间 NAS

企业仓库

其他仓库

ghcr · Quay · nvcr

Harbor 镜像源

Proxy Repository 对接

Portainer 镜像源

Registries 配置

Nexus 镜像源

Docker Proxy 缓存

开发工具

Dev Containers

VS Code 开发容器

Podman

Podman 配置指南

Singularity / Apptainer

HPC 科学计算容器

Kubernetes

K8s Containerd

Kubernetes · Containerd

K3s

轻量级集群

面板 / 网络

爱快路由

iKuai 镜像加速

宝塔面板

一键配置镜像源

AI

用 AI 使用轩辕镜像

agents.md · AI 对话 · 提示词

需要其他帮助？请查看我们的常见问题 Docker 镜像访问常见问题解答或提交工单

镜像拉取常见问题

功能

免费版与专业版区别

功能对比 · 版本选择

支持的镜像仓库

Docker Hub · GCR · GHCR

新手拉取配置

docker search 限制

专属域名 · Hub 搜索

不支持 push

仅支持 pull · 不支持

拉取速度原因

带宽 · 缓存 · 冷热镜像

排错

402 与流量用尽

402 · 流量包 · 充值

401 认证失败

401 · docker login

manifest unknown

标签错误 · 镜像不存在

410 Gone 排查

410 · Docker 升级

429 限流

免费版 · 请求频率

DNS 超时

DNS 解析 · 网络超时

账号

失败是否计费

manifest · blob · 计费

申请开发票（企业 / 个人）

企业 · 个人 · 工单

修改登录密码

网站 · 仓库 · 重置

注销账户

工单 · 数据 · 注销

原理

mirrors 不生效

daemon.json · 重启

去掉域名前缀

docker tag · 重命名

指定架构拉取

ARM64 · AMD64 · 多架构

latest 与「最新」

digest · 版本号 · 标签

查看全部问题→

用户好评

来自真实用户的反馈，见证轩辕镜像的优质服务

oldzhang

运维工程师

Linux服务器

"Docker访问体验非常流畅，大镜像也能快速完成下载。"

associatedpress/harvester

美联社开发的开源协作式数据收集工具，旨在帮助新闻编辑部以新闻速度收集结构化数据，通过 schema 驱动自动生成用户友好表单，使用 Google Sheets 作为存储机制，降低新项目启动门槛，快速开展数据收集工作。

AP Harvester Docker 镜像文档

镜像概述

核心功能与特性

使用场景与适用范围

前置准备：Google 凭据配置

使用方法

拉取 Docker 镜像

运行 Docker 容器

访问与使用

帮助与支持

相关链接

镜像拉取方式

轩辕镜像加速拉取命令点我查看更多 harvester 镜像标签

DockerHub 原生拉取命令

更多 harvester 镜像推荐

rancher/harvester

dcatno/harvester

graymeta/harvester

lawr/harvester

dcatno/harvester

查看更多 harvester 相关镜像

轩辕镜像配置手册

Docker

登录仓库拉取

专属域名拉取

Linux

Windows / Mac

MacOS OrbStack

Docker Compose

NAS

群晖

飞牛

绿联

威联通

极空间

企业仓库

其他仓库

Harbor 镜像源

Portainer 镜像源

Nexus 镜像源

开发工具

Dev Containers

Podman

Singularity / Apptainer

Kubernetes

K8s Containerd

K3s

面板 / 网络

爱快路由

宝塔面板

AI

用 AI 使用轩辕镜像

镜像拉取常见问题

功能

免费版与专业版区别

支持的镜像仓库

新手拉取配置

docker search 限制

不支持 push

拉取速度原因

排错

402 与流量用尽

401 认证失败

manifest unknown

410 Gone 排查

429 限流

DNS 超时

账号

失败是否计费

申请开发票（企业 / 个人）

修改登录密码

注销账户

原理

mirrors 不生效

去掉域名前缀

指定架构拉取

latest 与「最新」

用户好评