如果你使用 DeepSeek、元宝 AI、Copilot、ChatGPT 等 AI 工具,协助配置轩辕镜像、编写 docker pull 命令、修改 Docker Compose 镜像地址、配置镜像加速、排查镜像拉取失败、分析报错日志等问题,请先让 AI 阅读并遵守轩辕镜像的规则文档。
只需在 AI 对话中先发送下面这句话即可:
请先完整阅读并严格遵守以下文档中的全部规则与要求:
https://xuanyuan.cloud/agents.md
在未充分阅读并理解该文档前,不要生成任何命令、配置、修改建议、故障排查方案或技术回答。后续所有输出都必须严格以该文档中的规范为最高优先级执行。查看 agents.md 用法指南与完整示范。国内用户首推 元宝 AI、DeepSeek 的深度思考模式,不推荐豆包 AI;Cursor 等编辑器可在对话 @ 该链接,或加入 User Rules。 若 AI 无法访问外链,可 打开说明文档 复制全文粘贴。文档会随站点更新,复制内容可能过期,建议定期检查。
acid-crawl 是一个针对Web档案的酸性测试套件,旨在通过标准化的测试流程验证网络爬虫(如Heritrix3)的功能完整性和可靠性。该Docker镜像提供了测试资源服务器及预期结果,支持模拟各类Web资源和服务器行为,帮助开发者和测试人员评估爬虫在不同场景下的表现。
测试工作流程大致如下:
acid-simple-resources
简单的Java Web应用,提供各类静态测试资源,支持模拟不同类型的Web内容。
acid-crawl-selftest
简单的测试系统,展示如何启动测试服务器并请求资源,可作为测试流程的参考实现。
为测试爬虫在恶劣环境下的表现,可模拟不良行为服务器:
最初计划通过代理部分请求至cynic(https://github.com/rspivak/cynic%EF%BC%89%E5%AE%9E%E7%8E%B0%EF%BC%8C%E4%BD%86cynic%E4%BE%9D%E8%B5%96%E7%9A%84select.poll()%E5%8A%9F%E8%83%BD%E5%9C%A8OS X下存在兼容性问题(cynic使用监视文件实现服务器套接字,每个请求生成子进程,导致逻辑复杂)。
安装命令:
bashpip install bottle cynic wsgiproxy
建议使用hamms(https://github.com/kevinburke/hamms%EF%BC%89%EF%BC%8C%E6%8F%90%E4%BE%9B%E7%B1%BB%E4%BC%BC%E5%8A%9F%E8%83%BD%E4%B8%94%E5%AE%9E%E7%8E%B0%E6%9B%B4%E7%AE%80%E5%8D%95%E3%80%82
作为测试资源服务器,启动后可提供各类静态资源用于爬虫测试。具体使用需结合Docker容器启动命令,映射相应端口并访问测试资源。
作为测试演示系统,可通过其示例代码了解如何集成测试服务器、发起资源请求及验证结果,帮助构建自定义测试流程。
您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 标签列表页面。

来自真实用户的反馈,见证轩辕镜像的优质服务