
如果你使用 DeepSeek、元宝 AI、Copilot、ChatGPT 等 AI 工具,协助配置轩辕镜像、编写 docker pull 命令、修改 Docker Compose 镜像地址、配置镜像加速、排查镜像拉取失败、分析报错日志等问题,请先让 AI 阅读并遵守轩辕镜像的规则文档。
只需在 AI 对话中先发送下面这句话即可:
请先完整阅读并严格遵守以下文档中的全部规则与要求:
https://xuanyuan.cloud/agents.md
在未充分阅读并理解该文档前,不要生成任何命令、配置、修改建议、故障排查方案或技术回答。后续所有输出都必须严格以该文档中的规范为最高优先级执行。查看 agents.md 用法指南与完整示范。国内用户首推 元宝 AI、DeepSeek 的深度思考模式,不推荐豆包 AI;Cursor 等编辑器可在对话 @ 该链接,或加入 User Rules。 若 AI 无法访问外链,可 打开说明文档 复制全文粘贴。文档会随站点更新,复制内容可能过期,建议定期检查。
Dataprep微服务旨在预处理来自各种来源(结构化或非结构化数据)的数据为文本数据,并将文本数据转换为嵌入向量后存储到数据库中。
bashapt-get update apt-get install libreoffice
非结构化数据偶尔会包含图像数据,要将图像数据转换为文本数据,可使用LVM(大视觉模型)对图像进行总结。如需使用LVM,请先参考此https://github.com/opea-project/GenAIExamples/blob/main/../lvms/README.md%E5%90%AF%E5%8A%A8LVM%E5%BE%AE%E6%9C%8D%E5%8A%A1%EF%BC%8C%E7%84%B6%E5%90%8E%E5%9C%A8%E5%90%AF%E5%8A%A8%E4%BB%BB%E4%BD%95dataprep%E5%BE%AE%E6%9C%8D%E5%8A%A1%E4%B9%8B%E5%89%8D%E8%AE%BE%E7%BD%AE%E4%BB%A5%E4%B8%8B%E7%8E%AF%E5%A2%83%E5%8F%98%E9%87%8F%E3%80%82
bashexport SUMMARIZE_IMAGE_VIA_LVM=1
Dataprep微服务支持多种数据库,如下表所示,详情请参考以下各自的文档。
| 数据库 | 文档 |
|---|---|
Redis | https://github.com/opea-project/GenAIExamples/blob/main/src/README_redis.md |
Milvus | https://github.com/opea-project/GenAIExamples/blob/main/src/README_milvus.md |
Qdrant | https://github.com/opea-project/GenAIExamples/blob/main/src/README_qdrant.md |
Pinecone | https://github.com/opea-project/GenAIExamples/blob/main/src/README_pinecone.md |
PGVector | https://github.com/opea-project/GenAIExamples/blob/main/src/README_pgvector.md |
VDMS | https://github.com/opea-project/GenAIExamples/blob/main/src/README_vdms.md |
Multimodal | https://github.com/opea-project/GenAIExamples/blob/main/src/README_multimodal.md |
ElasticSearch | https://github.com/opea-project/GenAIExamples/blob/main/src/README_elasticsearch.md |
OpenSearch | https://github.com/opea-project/GenAIExamples/blob/main/src/README_opensearch.md |
neo4j | https://github.com/opea-project/GenAIExamples/blob/main/src/README_neo4j_llamaindex.md |
financial domain data | https://github.com/opea-project/GenAIExamples/blob/main/src/README_finance.md |
MariaDB | https://github.com/opea-project/GenAIExamples/blob/main/src/README_mariadb.md |
ArangoDB | https://github.com/opea-project/GenAIExamples/blob/main/src/README_arangodb.md |
在离线环境(即无互联网访问的环境)中运行dataprep微服务的通用步骤如下,适用于所有数据库后端:
huggingface-cli download --cache-dir <模型数据目录> <模型>dataprep微服务:<模型数据目录>挂载为dataprep容器内的/data目录dataprep微服务时设置环境变量HF_HUB_OFFLINE为1例如:docker run -d -v <模型数据目录>:/data -e HF_HUB_OFFLINE=1 ... ...
您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 标签列表页面。
来自真实用户的反馈,见证轩辕镜像的优质服务