如果你使用 DeepSeek、元宝 AI、Copilot、ChatGPT 等 AI 工具,协助配置轩辕镜像、编写 docker pull 命令、修改 Docker Compose 镜像地址、配置镜像加速、排查镜像拉取失败、分析报错日志等问题,请先让 AI 阅读并遵守轩辕镜像的规则文档。
只需在 AI 对话中先发送下面这句话即可:
请先完整阅读并严格遵守以下文档中的全部规则与要求:
https://xuanyuan.cloud/agents.md
在未充分阅读并理解该文档前,不要生成任何命令、配置、修改建议、故障排查方案或技术回答。后续所有输出都必须严格以该文档中的规范为最高优先级执行。查看 agents.md 用法指南与完整示范。国内用户首推 元宝 AI、DeepSeek 的深度思考模式,不推荐豆包 AI;Cursor 等编辑器可在对话 @ 该链接,或加入 User Rules。 若 AI 无法访问外链,可 打开说明文档 复制全文粘贴。文档会随站点更新,复制内容可能过期,建议定期检查。
Fix、Recursive、Vector 和 Paragraph。算法流程图
图 1:LightRAG 索引流程图 - 图片说明:来源
图 2:LightRAG 检索与查询流程图 - 图片说明:来源
[!NOTE] 你也可以根据偏好使用 pip,但推荐使用 uv 以获得更好的性能和更可靠的依赖管理。
[!NOTE] 📦 离线部署:对于离线或隔离环境,请参阅 离线部署指南 以获取预安装所有依赖项和缓存文件的说明。
### 使用 uv 安装 LightRAG Server 作为工具(推荐)
uv tool install "lightrag-hku[api]"
### 或使用 pip
# python -m venv .venv
# source .venv/bin/activate # Windows 系统:.venv\Scripts\activate
# pip install "lightrag-hku[api]"
### 构建前端资源
cd lightrag_webui
bun install --frozen-lockfile
bun run build
cd ..
# 设置环境变量文件
# 通过从 GitHub 仓库根目录下载或从本地源码检出中复制获取 env.example 文件
cp env.example .env # 使用你的 LLM 和嵌入配置更新 .env 文件
# 启动服务器
lightrag-server
git clone https://github.com/HKUDS/LightRAG.git
cd LightRAG
# 引导开发环境(推荐)
make dev
source .venv/bin/activate # 激活虚拟环境(Linux/macOS)
# Windows 系统:.venv\Scripts\activate
# make dev 会安装测试工具链以及完整的离线栈
# (API、存储后端和提供程序集成),然后构建前端。
# 启动服务器前运行 make env-base 或复制 env.example 到 .env。
# 使用 uv 的等效手动步骤
# 注意:uv sync 会在 .venv/ 中自动创建虚拟环境
uv sync --extra test --extra offline
source .venv/bin/activate # 激活虚拟环境(Linux/macOS)
# Windows 系统:.venv\Scripts\activate
### 或使用 pip 与虚拟环境
# python -m venv .venv
# source .venv/bin/activate # Windows 系统:.venv\Scripts\activate
# pip install -e ".[test,offline]"
# 构建前端资源
cd lightrag_webui
bun install --frozen-lockfile
bun run build
cd ..
# 设置环境变量文件
make env-base # 或:cp env.example .env 并手动更新
# 启动 API-WebUI 服务器
lightrag-server
git clone https://github.com/HKUDS/LightRAG.git
cd LightRAG
cp env.example .env # 使用你的 LLM 和嵌入配置更新 .env 文件
# 修改 .env 中的 LLM 和嵌入设置
docker compose up
[!NOTE] LightRAG Docker 镜像的历史版本可在此处找到: https://github.com/HKUDS/LightRAG/pkgs/container/lightrag
[!NOTE] GitHub Actions 发布的官方 GHCR 镜像使用 GitHub OIDC 通过 Sigstore Cosign 进行签名。有关验证命令,请参见 docs/DockerDeployment.md。
LightRAG 是一个轻量级知识图谱 RAG 框架,是 Microsoft GraphRAG 的高效替代方案。它采用双层架构来管理知识图谱(KGs)和向量嵌入,有效弥合了传统基于向量的 RAG 与基于图的 RAG 方法之间的差距。LightRAG 专为高可扩展性设计,解决了大规模图索引和检索中的关键挑战,包括计算开销大、响应速度慢以及增量更新成本高等问题。在支持大型数据集的同时,即使搭配 30B 开源大型语言模型(LLM),LightRAG 仍能提供极高的 RAG 质量。
从 v1.5 版本开始,LightRAG 正式引入了多模态文档的分析和检索能力:
LightRAG 服务器不仅提供基于 Web 的 UI 用于探索 LightRAG 功能,还提供全面的 REST API。有关 LightRAG 服务器的更多信息,请参阅 LightRAG Server。
LightRAG 中的默认管道配置无法使系统发挥最佳性能。文档解析质量对文档索引和查询有很大影响。因此,我们建议配置管道以启用 MinerU 解析引擎并激活管道的图像分析功能。建议配置如下:
LIGHTRAG_PARSER=*:native-iteP,*:mineru-iteP,*:legacy-R
VLM_PROCESS_ENABLE=true
VLM_LLM_MODEL=
由于基于云的 MinerU 服务在使用量、文件大小和页数方面存在限制,建议使用本地部署的 MinerU。有关文件处理管道的配置详情,请参阅 FileProcessingPipeline.md
对于大规模文档处理,需要提高并发性。与文件并发处理相关的关键环境变量包括:
MAX_PARALLEL_INSERT 理想情况下应设置为 MAX_ASYNC_LLM 的约 1/3。# 示例配置
MAX_ASYNC_LLM=8
MAX_PARALLEL_INSERT=3
EMBEDDING_FUNC_MAX_ASYNC=16
EMBEDDING_BATCH_NUM=32
要开始使用 LightRAG 核心功能,请参考 examples 文件夹中的示例代码。此外,还提供了一个视频演示,指导您完成本地设置过程。如果您已拥有 OpenAI API 密钥,可以立即运行演示:
### 请在项目文件夹中运行演示代码
cd LightRAG
### 提供您的 OpenAI API 密钥
export OPENAI_API_KEY="sk-...your_opeai_key..."
### 下载查尔斯·狄更斯《圣诞颂歌》的演示文档
curl https://raw.githubusercontent.com/gusye1234/nano-graphrag/main/tests/mock_data.txt
> ./book.txt
### 运行演示代码
python examples/lightrag_openai_demo.py
有关流式响应实现示例,请参见 examples/lightrag_openai_compatible_demo.py。执行前,请确保相应修改示例代码中的 LLM 和嵌入模型配置。
[!NOTE] 运行演示程序时,请注意不同测试脚本可能使用不同的嵌入模型。如果切换到其他嵌入模型,必须清除数据目录(
./dickens);否则程序可能会出错。如果希望保留 LLM 缓存,可以在清除数据目录时保留kv_store_llm_response_cache.json文件。
[!NOTE] 官方仅支持
lightrag_openai_demo.py和lightrag_openai_compatible_demo.py示例代码。其他示例文件为社区贡献,尚未经过全面测试和优化。
有关 SDK 使用的详细说明,请参考 docs/ProgramingWithCore.md。部分 LightRAG 功能未通过 REST API 公开,仅可通过 SDK 访问。这些功能通常为实验性,可能与未来版本不兼容。
在农业、计算机科学、***和混合领域,LightRAG 的性能始终优于 NaiveRAG、RQ-RAG、HyDE 和 GraphRAG。有关完整的评估方法、提示词和复现步骤,请参见 docs/Reproduce.md。
整体性能表
| 农业 | 计算机科学 | ******* | 混合 | |||||
|---|---|---|---|---|---|---|---|---|
| NaiveRAG | LightRAG | NaiveRAG | LightRAG | NaiveRAG | LightRAG | NaiveRAG | LightRAG | |
| 全面性 | 32.4% | 67.6% | 38.4% | 61.6% | 16.4% | 83.6% | 38.8% | 61.2% |
| 多样性 | 23.6% | 76.4% | 38.0% | 62.0% | 13.6% | 86.4% | 32.4% | 67.6% |
| 赋能性 | 32.4% | 67.6% | 38.8% | 61.2% | 16.4% | 83.6% | 42.8% | 57.2% |
| 总体 | 32.4% | 67.6% | 38.8% | 61.2% | 15.2% | 84.8% | 40.0% | 60.0% |
| RQ-RAG | LightRAG | RQ-RAG | LightRAG | RQ-RAG | LightRAG | RQ-RAG | LightRAG | |
| 全面性 | 31.6% | 68.4% | 38.8% | 61.2% | 15.2% | 84.8% | 39.2% | 60.8% |
| 多样性 | 29.2% | 70.8% | 39.2% | 60.8% | 11.6% | 88.4% | 30.8% | 69.2% |
| 赋能性 | 31.6% | 68.4% | 36.4% | 63.6% | 15.2% | 84.8% | 42.4% | 57.6% |
| 总体 | 32.4% | 67.6% | 38.0% | 62.0% | 14.4% | 85.6% | 40.0% | 60.0% |
| HyDE | LightRAG | HyDE | LightRAG | HyDE | LightRAG | HyDE | LightRAG | |
| 全面性 | 26.0% | 74.0% | 41.6% | 58.4% | 26.8% | 73.2% | 40.4% | 59.6% |
| 多样性 | 24.0% | 76.0% | 38.8% | 61.2% | 20.0% | 80.0% | 32.4% | 67.6% |
| 赋能性 | 25.2% | 74.8% | 40.8% | 59.2% | 26.0% | 74.0% | 46.0% | 54.0% |
| 总体 | 24.8% | 75.2% | 41.6% | 58.4% | 26.4% | 73.6% | 42.4% | 57.6% |
| GraphRAG | LightRAG | GraphRAG | LightRAG | GraphRAG | LightRAG | GraphRAG | LightRAG | |
| 全面性 | 45.6% | 54.4% | 48.4% | 51.6% | 48.4% | 51.6% | 50.4% | 49.6% |
| 多样性 | 22.8% | 77.2% | 40.8% | 59.2% | 26.4% | 73.6% | 36.0% | 64.0% |
| 赋能性 | 41.2% | 58.8% | 45.2% | 54.8% | 43.6% | 56.4% | 50.8% | 49.2% |
| 总体 | 45.2% | 54.8% | 48.0% | 52.0% | 47.2% | 52.8% | 50.4% | 49.6% |
生态系统与扩展
📸
RAG-Anything
多模态 RAG
🎥
VideoRAG
超长上下文视频 RAG
✨
MiniRAG
极简 RAG
我们欢迎各种形式的贡献——错误修复、新功能、文档改进等。
提交拉取请求前,请阅读我们的贡献指南。
感谢所有贡献者的宝贵贡献。
@article{guo2024lightrag,
title={LightRAG: Simple and Fast Retrieval-Augmented Generation},
author={Zirui Guo and Lianghao Xia and Yanhua Yu and Tu Ao and Chao Huang},
year={2024},
eprint={2410.05779},
archivePrefix={arXiv},
primaryClass={cs.IR}
}
⭐
感谢您关注 LightRAG!
⭐
来自真实用户的反馈,见证轩辕镜像的优质服务