热门搜索:

ghcr.iolinux/amd64v1.4.9.4-lite大小: 未知更新于 2026年5月23日

🚀 LightRAG: 简单快速的检索增强生成

🎉 新闻

[2026.05]🎯[新功能]: 将RagAnything合并至LightRAG🎉。通过MinerU / Docling服务实现多模态内容解析与提取。
[2026.05]🎯[新功能]: 引入四种可选文本分块策略：Fix、Recursive、Vector和Paragraph。
[2026.05]🎯[新功能]: 支持角色特定LLM配置，4种 distinct 角色：EXTRACT、QUERY、KEYWORDS和VLM，具备独立LLM设置。
[2026.03]🎯[新功能]: 集成OpenSearch作为统一存储后端，全面支持LightRAG的所有四种存储类型。
[2026.03]🎯[新功能]: 引入设置向导。支持通过Docker本地部署嵌入、重排序和存储后端。
[2025.11]🎯[新功能]: 集成RAGAS用于评估和Langfuse用于追踪。更新API以在查询结果中返回检索到的上下文，支持上下文精确率指标。
[2025.10]🎯[可扩展性增强]: 消除处理瓶颈，以高效支持大规模数据集。
[2025.09]🎯[新功能] 提升开源LLM（如Qwen3-30B-A3B）的知识图谱提取准确性。
[2025.08]🎯[新功能] 现已支持重排序器，显著提升混合查询的性能（设为默认查询模式）。
[2025.08]🎯[新功能] 添加文档删除功能，自动重新生成知识图谱以确保最佳查询性能。
[2025.06]🎯[新版本发布] 我们团队发布了https://github.com/HKUDS/RAG-Anything%E2%80%94%E2%80%94%E4%B8%80%E4%B8%AA**%E4%B8%80%E4%BD%93%E5%8C%96%E5%A4%9A%E6%A8%A1%E6%80%81RAG**%E7%B3%BB%E7%BB%9F%EF%BC%8C%E7%94%A8%E4%BA%8E%E6%97%A0%E7%BC%9D%E5%A4%84%E7%90%86%E6%96%87%E6%9C%AC%E3%80%81%E5%9B%BE%E5%83%8F%E3%80%81%E8%A1%A8%E6%A0%BC%E5%92%8C%E5%85%AC%E5%BC%8F%E3%80%82
[2025.06]🎯[新功能] LightRAG现在通过https://github.com/HKUDS/RAG-Anything%E9%9B%86%E6%88%90%E6%94%AF%E6%8C%81%E5%85%A8%E9%9D%A2%E7%9A%84%E5%A4%9A%E6%A8%A1%E6%80%81%E6%95%B0%E6%8D%AE%E5%A4%84%E7%90%86%EF%BC%8C%E5%AE%9E%E7%8E%B0%E8%B7%A8%E5%A4%9A%E7%A7%8D%E6%A0%BC%E5%BC%8F%EF%BC%88%E5%8C%85%E6%8B%ACPDF%E3%80%81%E5%9B%BE%E5%83%8F%E3%80%81Office%E6%96%87%E6%A1%A3%E3%80%81%E8%A1%A8%E6%A0%BC%E5%92%8C%E5%85%AC%E5%BC%8F%EF%BC%89%E7%9A%84%E6%97%A0%E7%BC%9D%E6%96%87%E6%A1%A3%E8%A7%A3%E6%9E%90%E5%92%8CRAG%E5%8A%9F%E8%83%BD%E3%80%82%E8%AF%A6%E6%83%85%E8%AF%B7%E5%8F%82%E9%98%85%E6%96%B0%E7%9A%84https://github.com/HKUDS/LightRAG/?tab=readme-ov-file#multimodal-document-processing-rag-anything-integration%E3%80%82
[2025.03]🎯[新功能] LightRAG现在支持引用功能，实现适当的来源归因和增强的文档可追溯性。
[2025.02]🎯[新功能] 现在可以使用MongoDB作为一体化存储解决方案，实现统一数据管理。
[2025.02]🎯[新版本发布] 我们团队发布了https://github.com/HKUDS/VideoRAG%E2%80%94%E2%80%94%E4%B8%80%E4%B8%AA%E7%94%A8%E4%BA%8E%E7%90%86%E8%A7%A3%E8%B6%85%E9%95%BF%E4%B8%8A%E4%B8%8B%E6%96%87%E8%A7%86%E9%A2%91%E7%9A%84RAG%E7%B3%BB%E7%BB%9F%E3%80%82
[2025.01]🎯[新版本发布] 我们团队发布了https://github.com/HKUDS/MiniRAG%EF%BC%8C%E9%80%9A%E8%BF%87%E5%B0%8F%E5%9E%8B%E6%A8%A1%E5%9E%8B%E7%AE%80%E5%8C%96RAG%E3%80%82
[2025.01]🎯现在可以使用PostgreSQL作为一体化存储解决方案进行数据管理。
[2024.11]🎯[新资源] LightRAG综合指南现已在LearnOpenCV上线——探索深入教程和最佳实践。非常感谢博客作者的杰出贡献！
[2024.11]🎯[新功能] 引入LightRAG WebUI——一个允许通过直观的基于Web的仪表板插入、查询和可视化LightRAG知识的界面。
[2024.11]🎯[新功能] 现在可以https://github.com/HKUDS/LightRAG?tab=readme-ov-file#using-neo4j-for-storage%E2%80%94%E2%80%94%E6%94%AF%E6%8C%81%E5%9B%BE%E6%95%B0%E6%8D%AE%E5%BA%93%E3%80%82
[2024.10]🎯[新功能] 我们添加了LightRAG介绍视频的链接——LightRAG功能演示。感谢作者的杰出贡献！
[2024.10]🎯[新渠道] 我们创建了***频道!💬 欢迎加入我们的社区进行分享、讨论和协作！ 🎉🎉

算法流程图

图1：LightRAG索引流程图 - 图片说明：来源
图2：LightRAG检索与查询流程图 - 图片说明：来源

安装

[!NOTE] 您也可以使用pip（如果偏好），但推荐使用uv以获得更好的性能和更可靠的依赖管理。

📦 离线部署：对于离线或隔离环境，请参阅离线部署指南以获取预安装所有依赖项和缓存文件的说明。

安装LightRAG服务器

LightRAG服务器旨在提供Web界面和API支持。Web界面便于文档索引、知识图谱探索和简单的RAG查询界面。LightRAG服务器还提供Ollama兼容接口，旨在将LightRAG模拟为Ollama聊天模型。这使得AI聊天机器人（如Open WebUI）可以轻松访问LightRAG。

从PyPI安装

### 使用uv安装LightRAG Server作为工具（推荐）
uv tool install "lightrag-hku[api]"

### 或使用pip
# python -m venv .venv
# source .venv/bin/activate # Windows：.venv\Scripts\activate
# pip install "lightrag-hku[api]"

### 构建前端资源
cd lightrag_webui
bun install --frozen-lockfile
bun run build
cd ..

# 设置环境文件
# 通过从GitHub仓库根目录下载或从本地源码副本复制获取env.example文件。
cp env.example .env # 使用您的LLM和嵌入配置更新.env文件
# 启动服务器
lightrag-server

从源码安装

git clone https://github.com/HKUDS/LightRAG.git
cd LightRAG

# 引导开发环境（推荐）
make dev
source .venv/bin/activate # 激活虚拟环境（Linux/macOS）
# Windows系统：.venv\Scripts\activate

# make dev会安装测试工具链以及完整的离线栈（API、存储后端和提供商集成），然后构建前端。
# 启动服务器前运行make env-base或复制env.example到.env。

# 使用uv的等效手动步骤
# 注意：uv sync会在.venv/中自动创建虚拟环境
uv sync --extra test --extra offline
source .venv/bin/activate # 激活虚拟环境（Linux/macOS）
# Windows系统：.venv\Scripts\activate

### 或使用pip与虚拟环境
# python -m venv .venv
# source .venv/bin/activate # Windows：.venv\Scripts\activate
# pip install -e ".[test,offline]"

# 构建前端资源
cd lightrag_webui
bun install --frozen-lockfile
bun run build
cd ..

# 设置环境文件
make env-base # 或：cp env.example .env并手动更新
# 启动API-WebUI服务器
lightrag-server

使用Docker Compose启动LightRAG服务器

git clone https://github.com/HKUDS/LightRAG.git
cd LightRAG
cp env.example .env # 使用您的LLM和嵌入配置更新.env文件
# 在.env中修改LLM和嵌入设置
docker compose up

使用设置工具创建 .env 文件

无需手动编辑 env.example，可使用交互式设置向导生成已配置的 .env 文件，必要时还会生成 docker-compose.final.yml：

make env-base # 必要的第一步：LLM、embedding、reranker
make env-storage # 可选：存储后端和数据库服务
make env-server # 可选：服务器端口、认证和 SSL
make env-base-rewrite # 可选：强制重新生成向导管理的 compose 服务
make env-storage-rewrite # 可选：强制重新生成向导管理的 compose 服务
make env-security-check # 可选：审计当前 .env 的安全风险

有关每个目标的完整说明，请参见 docs/InteractiveSetup.md。设置向导仅更新配置；部署前需单独运行 make env-security-check 以审计当前 .env 文件的安全风险。默认情况下，重新运行设置会保留未更改的向导管理的 compose 服务块；仅当需要从捆绑模板重新构建这些管理块时，才使用 *-rewrite 目标。

安装 LightRAG Core

从源码安装（推荐）

cd LightRAG
# 注意：uv sync 会在 .venv/ 中自动创建虚拟环境
uv sync
source .venv/bin/activate # 激活虚拟环境（Linux/macOS）
# Windows 系统：.venv\Scripts\activate

# 或者：pip install -e .

从 PyPI 安装

uv pip install lightrag-hku
# 或者：pip install lightrag-hku

快速开始

LightRAG 的 LLM 和技术栈要求

LightRAG 对大型语言模型（LLM）能力的要求显著高于传统 RAG，因为它需要 LLM 从文档中执行实体关系提取任务。配置合适的 Embedding 和 Reranker 模型对于提升查询性能也至关重要。

LLM 选择：
- 建议使用参数至少为 320 亿的 LLM。
- 上下文长度至少应为 32KB，推荐 64KB。
- 文档索引阶段不建议选择推理模型。
- 查询阶段建议选择能力强于索引阶段所用模型的模型，以获得更好的查询结果。
Embedding 模型：
- 高性能的 Embedding 模型是 RAG 的核心。
- 建议使用主流多语言 Embedding 模型，例如：BAAI/bge-m3 和 text-embedding-3-large。

[!IMPORTANT] Embedding 模型必须在文档索引前确定，且文档查询阶段必须使用相同模型。对于某些存储解决方案（如 PostgreSQL），向量维度必须在初始表创建时定义。因此，更换 Embedding 模型时，需删除现有向量相关表，让 LightRAG 使用新维度重新创建。

Reranker 模型配置：
- 配置 Reranker 模型可显著提升 LightRAG 的检索性能。
- 启用 Reranker 模型时，建议将“混合模式”设为默认查询模式。
- 建议使用主流 Reranker 模型，例如：BAAI/bge-reranker-v2-m3 或 Jina 等服务提供的模型。

LightRAG Server 快速开始

LightRAG Server 旨在提供 Web UI 和 API 支持。它具备全面的知识图谱可视化功能，支持多种引力布局、节点查询、子图过滤等。有关 LightRAG Server 的更多信息，请参见 LightRAG Server。

LightRAG core 快速开始

要开始使用 LightRAG core，请参考 examples 文件夹中的示例代码。此外，还提供了视频演示指导本地设置过程。如果您已有 OpenAI API 密钥，可立即运行演示：

### 需在项目文件夹中运行演示代码
cd LightRAG
### 提供您的 OpenAI API 密钥
export OPENAI_API_KEY="sk-...your_opeai_key..."
### 下载查尔斯·狄更斯的《圣诞颂歌》演示文档
curl https://raw.githubusercontent.com/gusye1234/nano-graphrag/main/tests/mock_data.txt
> ./book.txt
### 运行演示代码
python examples/lightrag_openai_demo.py

有关流式响应实现示例，请参见 examples/lightrag_openai_compatible_demo.py。执行前，请确保相应修改示例代码中的 LLM 和 Embedding 配置。

[!NOTE] 注意 1：运行演示程序时，请注意不同测试脚本可能使用不同的 Embedding 模型。如果切换到不同的 Embedding 模型，必须清除数据目录（./dickens）；否则程序可能会出错。如果希望保留 LLM 缓存，可在清除数据目录时保留 kv_store_llm_response_cache.json 文件。

[!NOTE] 注意 2：仅 lightrag_openai_demo.py 和 lightrag_openai_compatible_demo.py 是官方支持的示例代码。其他示例文件为社区贡献，未经全面测试和优化。

使用 LightRAG Core 编程

完整的 Core API 参考（包括初始化参数、QueryParam、LLM/Embedding 提供商示例（OpenAI、Ollama、Azure、Gemini、HuggingFace、LlamaIndex）、Reranker 注入、插入操作、实体/关系管理以及删除/合并），请参见 docs/ProgramingWithCore.md。

[!IMPORTANT] 如果您想将 LightRAG 集成到项目中，建议使用 LightRAG Server 提供的 REST API。LightRAG Core 通常用于嵌入式应用或希望进行研究和评估的研究人员。

高级功能

LightRAG 提供额外功能，包括令牌使用跟踪、知识图谱数据导出、LLM 缓存管理、Langfuse 可观测性集成以及基于 RAGAS 的评估。详见 docs/AdvancedFeatures.md。

多模态文档处理

LightRAG Server 包含多模态文档处理流水线，支持 PDF、Office 文档、图像、表格和公式。解析通过外部 MinerU 或 Docling 服务处理，而多模态索引在 LightRAG 流水线中运行。设置详情请参见 docs/AdvancedFeatures.md。

复现论文中的研究结果

LightRAG在农业、计算机科学、***和混合领域中始终优于NaiveRAG、RQ-RAG、HyDE和GraphRAG。有关完整的评估方法、提示词和复现步骤，请参见 docs/Reproduce.md。

整体性能表

	农业		计算机科学		*******		混合
	NaiveRAG	LightRAG	NaiveRAG	LightRAG	NaiveRAG	LightRAG	NaiveRAG	LightRAG
全面性	32.4%	67.6%	38.4%	61.6%	16.4%	83.6%	38.8%	61.2%
多样性	23.6%	76.4%	38.0%	62.0%	13.6%	86.4%	32.4%	67.6%
赋能性	32.4%	67.6%	38.8%	61.2%	16.4%	83.6%	42.8%	57.2%
总体	32.4%	67.6%	38.8%	61.2%	15.2%	84.8%	40.0%	60.0%
	RQ-RAG	LightRAG	RQ-RAG	LightRAG	RQ-RAG	LightRAG	RQ-RAG	LightRAG
全面性	31.6%	68.4%	38.8%	61.2%	15.2%	84.8%	39.2%	60.8%
多样性	29.2%	70.8%	39.2%	60.8%	11.6%	88.4%	30.8%	69.2%
赋能性	31.6%	68.4%	36.4%	63.6%	15.2%	84.8%	42.4%	57.6%
总体	32.4%	67.6%	38.0%	62.0%	14.4%	85.6%	40.0%	60.0%
	HyDE	LightRAG	HyDE	LightRAG	HyDE	LightRAG	HyDE	LightRAG
全面性	26.0%	74.0%	41.6%	58.4%	26.8%	73.2%	40.4%	59.6%
多样性	24.0%	76.0%	38.8%	61.2%	20.0%	80.0%	32.4%	67.6%
赋能性	25.2%	74.8%	40.8%	59.2%	26.0%	74.0%	46.0%	54.0%
总体	24.8%	75.2%	41.6%	58.4%	26.4%	73.6%	42.4%	57.6%
	GraphRAG	LightRAG	GraphRAG	LightRAG	GraphRAG	LightRAG	GraphRAG	LightRAG
全面性	45.6%	54.4%	48.4%	51.6%	48.4%	51.6%	50.4%	49.6%
多样性	22.8%	77.2%	40.8%	59.2%	26.4%	73.6%	36.0%	64.0%
赋能性	41.2%	58.8%	45.2%	54.8%	43.6%	56.4%	50.8%	49.2%
总体	45.2%	54.8%	48.0%	52.0%	47.2%	52.8%	50.4%	49.6%

🔗 相关项目

生态系统与扩展

📸

RAG-Anything
多模态RAG

🎥

VideoRAG
超长上下文视频RAG

✨

MiniRAG
极简RAG

⭐ 星级历史

🤝 贡献

我们欢迎各种形式的贡献——错误修复、新功能、文档改进等。提交拉取请求前，请阅读我们的《贡献指南》。

感谢所有贡献者的宝贵贡献。

📖 引用

@article{guo2024lightrag,
title={LightRAG: Simple and Fast Retrieval-Augmented Generation},
author={Zirui Guo and Lianghao Xia and Yanhua Yu and Tu Ao and Chao Huang},
year={2024},
eprint={2410.05779},
archivePrefix={arXiv},
primaryClass={cs.IR}
}

⭐
感谢您关注LightRAG！
⭐

轩辕镜像配置手册

探索更多轩辕镜像的使用方法，找到最适合您系统的配置方式

Docker 配置

登录仓库拉取

通过 Docker 登录认证访问私有仓库

专属域名拉取

无需登录使用专属域名

K8s Containerd

Kubernetes 集群配置 Containerd

K3s

K3s 轻量级 Kubernetes 镜像加速

Dev Containers

VS Code Dev Containers 配置

Podman

Podman 容器引擎配置

Singularity/Apptainer

HPC 科学计算容器配置

其他仓库配置

ghcr、Quay、nvcr 等镜像仓库

Harbor 镜像源配置

Harbor Proxy Repository 对接专属域名

Portainer 镜像源配置

Portainer Registries 加速拉取

Nexus 镜像源配置

Nexus3 Docker Proxy 内网缓存

系统配置

Linux

在 Linux 系统配置镜像服务

Windows/Mac

在 Docker Desktop 配置镜像

MacOS OrbStack

MacOS OrbStack 容器配置

Docker Compose

Docker Compose 项目配置

NAS 设备

群晖

Synology 群晖 NAS 配置

飞牛

飞牛 fnOS 系统配置镜像

绿联

绿联 NAS 系统配置镜像

威联通

QNAP 威联通 NAS 配置

极空间

极空间 NAS 系统配置服务

网络设备

爱快路由

爱快 iKuai 路由系统配置

宝塔面板

在宝塔面板一键配置镜像

需要其他帮助？请查看我们的常见问题Docker 镜像访问常见问题解答或提交工单

镜像拉取常见问题

使用与功能问题

配置了专属域名后，docker search 为什么会报错？

docker search 限制

Docker Hub 上有的镜像，为什么在轩辕镜像网站搜不到？

站内搜不到镜像

机器不能直连外网时，怎么用 docker save / load 迁镜像？

离线 save/load

docker pull 拉插件报错（plugin v1+json）怎么办？

插件要用 plugin install

WSL 里 Docker 拉镜像特别慢，怎么排查和优化？

WSL 拉取慢

轩辕镜像安全吗？如何用 digest 校验镜像没被篡改？

安全与 digest

第一次用轩辕镜像拉 Docker 镜像，要怎么登录和配置？

新手拉取配置

轩辕镜像合规吗？轩辕镜像的合规是怎么做的？

镜像合规机制

轩辕镜像支持 docker push 上传本地镜像吗？

不支持 push

错误码与失败问题

docker pull 提示 manifest unknown 怎么办？

manifest unknown

docker pull 提示 no matching manifest 怎么办？

no matching manifest（架构）

镜像已拉取完成，却提示 invalid tar header 或 failed to register layer 怎么办？

invalid tar header（解压）

Docker pull 时 HTTPS / TLS 证书验证失败怎么办？

TLS 证书失败

Docker pull 时 DNS 解析超时或连不上仓库怎么办？

DNS 超时

docker 无法连接轩辕镜像域名怎么办？

域名连通性排查

Docker 拉取出现 410 Gone 怎么办？

410 Gone 排查

出现 402 或「流量用尽」提示怎么办？

402 与流量用尽

Docker 拉取提示 UNAUTHORIZED（401）怎么办？

401 认证失败

遇到 429 Too Many Requests（请求太频繁）怎么办？

429 限流

docker login 提示 Cannot autolaunch D-Bus，还算登录成功吗？

D-Bus 凭证提示

为什么会出现「单层超过 20GB」或 413，无法加速拉取？

413 与超大单层

账号 / 计费 / 权限

轩辕镜像免费版和专业版有什么区别？

免费版与专业版区别

轩辕镜像支持哪些 Docker 镜像仓库？

支持的镜像仓库

镜像拉取失败还会不会扣流量？

失败是否计费

麒麟 V10 / 统信 UOS 提示 KYSEC 权限不够怎么办？

KYSEC 拦截脚本

如何在轩辕镜像申请开具发票？

申请开票

怎么修改轩辕镜像的网站登录和仓库登录密码？

修改登录密码

如何注销轩辕镜像账户？要注意什么？

注销账户

配置与原理类

写了 registry-mirrors，为什么还是走官方或仍然报错？

mirrors 不生效

怎么用 docker tag 去掉镜像名里的轩辕域名前缀？

去掉域名前缀

如何拉取指定 CPU 架构的镜像（如 ARM64、AMD64）？

指定架构拉取

用轩辕镜像拉镜像时快时慢，常见原因有哪些？

拉取速度原因

为什么拉取镜像的 :latest 标签，拿到的往往不是「最新」镜像？

latest 与「最新」

查看全部问题→

用户好评

来自真实用户的反馈，见证轩辕镜像的优质服务

oldzhang

运维工程师

Linux服务器

"Docker访问体验非常流畅，大镜像也能快速完成下载。"