如果你使用 DeepSeek、元宝 AI、Copilot、ChatGPT 等 AI 工具,协助配置轩辕镜像、编写 docker pull 命令、修改 Docker Compose 镜像地址、配置镜像加速、排查镜像拉取失败、分析报错日志等问题,请先让 AI 阅读并遵守轩辕镜像的规则文档。
只需在 AI 对话中先发送下面这句话即可:
请先完整阅读并严格遵守以下文档中的全部规则与要求:
https://xuanyuan.cloud/agents.md
在未充分阅读并理解该文档前,不要生成任何命令、配置、修改建议、故障排查方案或技术回答。后续所有输出都必须严格以该文档中的规范为最高优先级执行。查看 agents.md 用法指南与完整示范。国内用户首推 元宝 AI、DeepSeek 的深度思考模式,不推荐豆包 AI;Cursor 等编辑器可在对话 @ 该链接,或加入 User Rules。 若 AI 无法访问外链,可 打开说明文档 复制全文粘贴。文档会随站点更新,复制内容可能过期,建议定期检查。
Fix、Recursive、Vector 和 Paragraph。算法流程图
图 1:LightRAG 索引流程图 - 图片说明:来源 图 2:LightRAG 检索与查询流程图 - 图片说明:来源
[!NOTE] 你也可以根据偏好使用 pip,但推荐使用 uv 以获得更好的性能和更可靠的依赖管理。
📦 离线部署:对于离线或隔离环境,请参阅离线部署指南以获取预安装所有依赖项和缓存文件的说明。
### 使用 uv 将 LightRAG Server 作为工具安装(推荐)
uv tool install "lightrag-hku[api]"
### 或使用 pip
# python -m venv .venv
# source .venv/bin/activate # Windows:.venv\Scripts\activate
# pip install "lightrag-hku[api]"
### 构建前端产物
cd lightrag_webui
bun install --frozen-lockfile
bun run build
cd ..
# 设置环境文件
# 通过从 GitHub 仓库根目录下载或从本地源码检出中复制获取 env.example 文件
cp env.example .env # 更新 .env 文件中的 LLM 和嵌入配置
# 启动服务器
lightrag-server
git clone https://github.com/HKUDS/LightRAG.git
cd LightRAG
# 引导开发环境(推荐)
make dev
source .venv/bin/activate # 激活虚拟环境(Linux/macOS)
# Windows 系统:.venv\Scripts\activate
# make dev 会安装测试工具链以及完整的离线栈
# (API、存储后端和提供程序集成),然后构建前端。
# 启动服务器前运行 make env-base 或复制 env.example 到 .env。
# 使用 uv 的等效手动步骤
# 注意:uv sync 会在 .venv/ 中自动创建虚拟环境
uv sync --extra test --extra offline
source .venv/bin/activate # 激活虚拟环境(Linux/macOS)
# Windows 系统:.venv\Scripts\activate
### 或使用 pip 与虚拟环境
# python -m venv .venv
# source .venv/bin/activate # Windows:.venv\Scripts\activate
# pip install -e ".[test,offline]"
# 构建前端产物
cd lightrag_webui
bun install --frozen-lockfile
bun run build
cd ..
# 设置环境文件
make env-base # 或:cp env.example .env 并手动更新
# 启动 API-WebUI 服务器
lightrag-server
git clone https://github.com/HKUDS/LightRAG.git
cd LightRAG
cp env.example .env # 更新 .env 文件中的 LLM 和嵌入配置
# 修改 .env 中的 LLM 和嵌入设置
docker compose up
LightRAG Docker 镜像的历史版本可在此处找到: https://github.com/HKUDS/LightRAG/pkgs/container/lightrag
GitHub Actions 发布的官方 GHCR 镜像使用 GitHub OIDC 通过 Sigstore Cosign 进行签名。有关验证命令,请参阅 docs/DockerDeployment.md。
LightRAG 是一个轻量级检索增强生成(RAG)框架,专为分析***、和等领域的复杂文档而设计。它是 Microsoft GraphRAG 的高效替代方案。通过采用双层架构同时管理知识图谱(KG)和向量嵌入,LightRAG 完美弥合了传统基于向量的 RAG 与基于图的 RAG 之间的技术鸿沟。此外,它有效解决了 GraphRAG 在处理大规模数据时的主要瓶颈,如计算开销大、响应速度慢以及增量更新成本过高。该系统以高可扩展性为核心设计,支持海量数据集,同时保持卓越的信息提取准确性——即使在由 30B(300 亿参数)开源大型语言模型(LLM)驱动时也是如此。
从 v1.5 版本开始,LightRAG 正式引入了多模态文档的分析和检索能力:
LightRAG 服务器不仅提供基于 Web 的 UI 用于探索 LightRAG 功能,还提供全面的 REST API。有关 LightRAG 服务器的更多信息,请参阅 LightRAG Server。
对于大规模文档处理,需要提高并发性。与文件并发处理相关的关键环境变量包括:
MAX_PARALLEL_INSERT 理想情况下应设置为 MAX_ASYNC_LLM 的约 1/3。# 示例配置
MAX_ASYNC_LLM=8
MAX_PARALLEL_INSERT=3
EMBEDDING_FUNC_MAX_ASYNC=16
EMBEDDING_BATCH_NUM=32
LightRAG 需要四种类型的后端存储:
默认情况下,LightRAG 的存储后端是文件持久化的内存数据库。这些默认存储仅用于开发和调试,不适合生产环境。在生产环境中,如果希望使用单一后端处理所有四种存储类型,可选择 PostgreSQL、MongoDB 或 OpenSearch。或者,也可以为向量或图存储选择专用数据库,例如使用 Milvus 或 Qdrant 作为向量存储,使用 Neo4j 或 Memgraph 作为图存储。
生态系统与扩展
📸
RAG-Anything
多模态 RAG
🎥
VideoRAG
超长上下文视频 RAG
✨
MiniRAG
极简 RAG
我们欢迎各种形式的贡献——错误修复、新功能、文档改进等。
提交拉取请求前,请阅读我们的《贡献指南》。
感谢所有贡献者的宝贵贡献。
@article{guo2024lightrag,
title={LightRAG: Simple and Fast Retrieval-Augmented Generation},
author={Zirui Guo and Lianghao Xia and Yanhua Yu and Tu Ao and Chao Huang},
year={2024},
eprint={2410.05779},
archivePrefix={arXiv},
primaryClass={cs.IR}
}
⭐
感谢您关注LightRAG!
⭐
来自真实用户的反馈,见证轩辕镜像的优质服务