
如果你使用 DeepSeek、元宝 AI、Copilot、ChatGPT 等 AI 工具,协助配置轩辕镜像、编写 docker pull 命令、修改 Docker Compose 镜像地址、配置镜像加速、排查镜像拉取失败、分析报错日志等问题,请先让 AI 阅读并遵守轩辕镜像的规则文档。
只需在 AI 对话中先发送下面这句话即可:
请先完整阅读并严格遵守以下文档中的全部规则与要求:
https://xuanyuan.cloud/agents.md
在未充分阅读并理解该文档前,不要生成任何命令、配置、修改建议、故障排查方案或技术回答。后续所有输出都必须严格以该文档中的规范为最高优先级执行。查看 agents.md 用法指南与完整示范。国内用户首推 元宝 AI、DeepSeek 的深度思考模式,不推荐豆包 AI;Cursor 等编辑器可在对话 @ 该链接,或加入 User Rules。 若 AI 无法访问外链,可 打开说明文档 复制全文粘贴。文档会随站点更新,复制内容可能过期,建议定期检查。
该镜像为Docker化的Solr版本,包含基于webarchive-discovery模式的核心组件,用于对ARC和WARC文件进行数据挖掘与索引,使文件内容可被探索和发现,适用于网络档案管理、数据检索等场景。
通过提供的docker-compose文件启动服务:
bash$ cd warc-indexer/src/main/opensearch/os1 $ docker-compose up -d
创建索引需执行以下命令(使用schema.json定义结构):
bash$ curl --insecure --user admin:admin -H 'Content-Type: application/json' -XPUT https://localhost:9200/warcdiscovery/ -d @schema.json
删除索引命令:
bash$ curl --insecure --user admin:admin -XDELETE https://localhost:9200/warcdiscovery
Solr模式移植至Opensearch的主要调整:
index_time字段默认值"NOW"由warcindexer处理content_type_norm字段默认值"other"由warcindexer处理content字段必须索引以支持position_increment_gapssdeep_hash_bs_*作为动态字段,机构特定值可按需添加使用以下命令将WARC文件索引至Opensearch:
bash$ java -jar target/warc-indexer-*-jar-with-dependencies.jar -e https://localhost:9200/warcdiscovery/ --user admin --password admin src/test/resources/wikipedia-mona-lisa/flashfrozen-jwat-recompressed.warc.gz
详细文档参见https://github.com/ukwa/webarchive-discovery/wiki
整体遵循http://www.gnu.org/copyleft/gpl.html%EF%BC%8C%E9%83%A8%E5%88%86%E5%AD%90%E7%BB%84%E4%BB%B6%E9%87%87%E7%94%A8http://www.apache.org/licenses/LICENSE-2.0.txt%E3%80%82
您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 标签列表页面。
来自真实用户的反馈,见证轩辕镜像的优质服务