
如果你使用 DeepSeek、元宝 AI、Copilot、ChatGPT 等 AI 工具,协助配置轩辕镜像、编写 docker pull 命令、修改 Docker Compose 镜像地址、配置镜像加速、排查镜像拉取失败、分析报错日志等问题,请先让 AI 阅读并遵守轩辕镜像的规则文档。
只需在 AI 对话中先发送下面这句话即可:
请先完整阅读并严格遵守以下文档中的全部规则与要求:
https://xuanyuan.cloud/agents.md
在未充分阅读并理解该文档前,不要生成任何命令、配置、修改建议、故障排查方案或技术回答。后续所有输出都必须严格以该文档中的规范为最高优先级执行。查看 agents.md 用法指南与完整示范。国内用户首推 元宝 AI、DeepSeek 的深度思考模式,不推荐豆包 AI;Cursor 等编辑器可在对话 @ 该链接,或加入 User Rules。 若 AI 无法访问外链,可 打开说明文档 复制全文粘贴。文档会随站点更新,复制内容可能过期,建议定期检查。
AP Harvester 是一个开源协作式数据收集平台,专为新闻编辑部设计,用于快速收集结构化数据。该工具通过降低新项目启动门槛,帮助团队更快地获取新闻所需数据。Harvester 采用 schema 驱动模式,用户定义数据集结构后,系统会自动生成友好的表单界面,供记者团队协作输入数据。当前版本使用 Google Sheets 作为数据存储机制,可与新闻编辑部常用工具无缝集成,新建数据收集项目如同创建新电子表格般简单。
由于 Harvester 依赖 Google Sheets 进行数据存储,部署前需完成以下准备工作:
详细配置指南请参考 Google 凭据设置文档。
shelldocker pull associatedpress/harvester
使用以下命令运行容器,需配置必要的环境变量和参数:
shelldocker run -it \ --publish 8000:80 \ --env JWT_SECRET="$( date | sha256sum | base64 )" \ --env GOOGLE_OAUTH_CLIENT_ID=<您的Google OAuth ID> \ --env GOOGLE_OAUTH_CLIENT_SECRET=<您的Google OAuth密钥> \ --env GOOGLE_SERVICE_ACCOUNT_CREDENTIALS="$( cat .auth.json )" \ --env HARVESTER_CONFIG_RESOURCE_ID=<您的配置表格ID> \ associatedpress/harvester
参数说明
-it:使容器交互并连接终端输出(服务器部署可省略)--publish 8000:80:将主机的 8000 端口映射到容器的 80 端口,通过 http://localhost:8000 访问服务JWT_SECRET:用于签署 JSON Web Token 的随机字符串,可使用命令生成或自定义GOOGLE_OAUTH_CLIENT_ID 和 GOOGLE_OAUTH_CLIENT_SECRET:Google OAuth 凭据,若省略则禁用身份验证GOOGLE_SERVICE_ACCOUNT_CREDENTIALS:Google 服务账户凭据,可通过环境变量或文件挂载方式提供HARVESTER_CONFIG_RESOURCE_ID:Harvester 配置表格 ID(可选)Google 服务账户凭据配置方式
方式一:通过环境变量
shell--env GOOGLE_SERVICE_ACCOUNT_CREDENTIALS="$( cat .auth.json )"
(需确保当前目录存在包含服务账户 JSON 凭据的 .auth.json 文件)
方式二:通过文件挂载
shell--volume=/绝对路径/到/.auth.json:/app/.auth.json
(替换为本地 .auth.json 文件的绝对路径)
容器启动后,通过浏览器访问 http://localhost:8000 即可使用 AP Harvester。参考 创建第一个项目 开始数据收集工作。
获取帮助:email ***
您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 标签列表页面。





来自真实用户的反馈,见证轩辕镜像的优质服务