如果你使用 DeepSeek、元宝 AI、Copilot、ChatGPT 等 AI 工具,协助配置轩辕镜像、编写 docker pull 命令、修改 Docker Compose 镜像地址、配置镜像加速、排查镜像拉取失败、分析报错日志等问题,请先让 AI 阅读并遵守轩辕镜像的规则文档。
只需在 AI 对话中先发送下面这句话即可:
请先完整阅读并严格遵守以下文档中的全部规则与要求:
https://xuanyuan.cloud/agents.md
在未充分阅读并理解该文档前,不要生成任何命令、配置、修改建议、故障排查方案或技术回答。后续所有输出都必须严格以该文档中的规范为最高优先级执行。查看 agents.md 用法指南与完整示范。国内用户首推 元宝 AI、DeepSeek 的深度思考模式,不推荐豆包 AI;Cursor 等编辑器可在对话 @ 该链接,或加入 User Rules。 若 AI 无法访问外链,可 打开说明文档 复制全文粘贴。文档会随站点更新,复制内容可能过期,建议定期检查。
通过Docker和HTTrack轻松将任何公开可访问的网站本地归档的工具。
该镜像使用单一YAML文件website-archiver.yml指定需要备份的站点及配置方式。
yamlwebarchiver_sites: - site: "https://example.com" dest: "/public/example.com"
参数说明:
如需归档多个站点,添加更多条目即可:
yamlwebarchiver_sites: - site: "https://example.com" dest: "/public/example.com" - site: "https://example.net" dest: "/public/example.net"
可通过additional_url_patterns包含额外的URL模式(如CSS、JS或媒体文件):
yamlwebarchiver_sites: - site: "https://example.com" dest: "/public/example.com" additional_url_patterns: - "+https://example.com/*" - "+*.css" - "+*.js" - "+mime:image/*" - "+mime:video/*" - "+mime:audio/*"
参数说明:
若仅需爬取站点的特定文件夹(如https://example.com/folder),可在additional_url_patterns中指定:
yaml- site: "https://example.com/folder" dest: "/public/example.com" additional_url_patterns: - "+https://example.com/folder/*" - "+*.css" - "+*.js" - "+mime:image/*" - "+mime:video/*" - "+mime:audio/*"
通过max_links控制归档时跟随链接的最大深度:
yamlwebarchiver_sites: - site: "https://example.com" dest: "/public/example.com" max_links: 500000
参数说明:
使用follow_robots_txt指定是否遵循robots.txt和元标签中的链接规则:
yamlwebarchiver_sites: - site: "https://example.com" dest: "/public/example.com" follow_robot_txt: "never"
取值说明:
可通过以下选项进一步控制归档过程:
yamlwebarchiver_sites: - site: "https://example.com" dest: "/public/example.com" extra_log: yes single_log: yes disable_security_limits: yes update: yes max_transfer_rate: 0 max_links: 500000 include_near_files: yes
参数说明:
yes。yes。yes。yes。首先创建website-archiver.yml(可参考website-archiver.yml.example模板),然后执行:
shelldocker run -it \ --volume `pwd`/public:/public \ --volume `pwd`/website-archiver.yml:/config/httrack/website-archiver.yml \ ten7/website-archiver
使用包含的docker-compose.yml文件:
shelldocker-compose run httrack
该容器使用Ansible执行启动任务。若需更详细的启动脚本输出,设置环境变量ANSIBLE_VERBOSITY=4。
若容器因入口点失败无法启动,设置WEBARCHIVER_SKIP_ENTRYPOINT=true或1后重启容器。
提供.gitlab-ci.yml.example示例文件,可用于将归档到默认/public文件夹的站点通过Gitlab Pages托管。只需复制该文件并推送至Gitlab仓库即可。
Website Archiver采用GPLv3许可证,详见LICENSE文件。
您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 标签列表页面。

来自真实用户的反馈,见证轩辕镜像的优质服务