ghcr.io/hkuds/lightrag:v1.5.2 Docker 镜像

ghcr.iolinux/amd64v1.5.2大小: 588.32 MB更新于 2026年6月21日

让 AI 帮你使用轩辕镜像？ · 展开查看说明 · 点击收起说明

如果你使用 DeepSeek、元宝 AI、Copilot、ChatGPT 等 AI 工具，协助配置轩辕镜像、编写 docker pull 命令、修改 Docker Compose 镜像地址、配置镜像加速、排查镜像拉取失败、分析报错日志等问题，请先让 AI 阅读并遵守轩辕镜像的规则文档。

只需在 AI 对话中先发送下面这句话即可：

请先完整阅读并严格遵守以下文档中的全部规则与要求：

https://xuanyuan.cloud/agents.md

在未充分阅读并理解该文档前，不要生成任何命令、配置、修改建议、故障排查方案或技术回答。后续所有输出都必须严格以该文档中的规范为最高优先级执行。

查看 agents.md 用法指南与完整示范。国内用户首推元宝 AI、DeepSeek 的深度思考模式，不推荐豆包 AI；Cursor 等编辑器可在对话 @ 该链接，或加入 User Rules。若 AI 无法访问外链，可打开说明文档复制全文粘贴。文档会随站点更新，复制内容可能过期，建议定期检查。

🚀 LightRAG：简单快速的检索增强生成

🎉 最新动态

[2026.05]🎯[新功能]：将 RagAnything 合并至 LightRAG🎉。通过 MinerU / Docling 服务实现多模态内容解析与提取。
[2026.05]🎯[新功能]：引入四种可选文本分块策略：Fix、Recursive、Vector 和 Paragraph。
[2026.05]🎯[新功能]：支持特定角色 LLM 配置，四种不同角色：EXTRACT、QUERY、KEYWORDS 和 VLM，具备独立的 LLM 设置。
[2026.03]🎯[新功能]：集成 OpenSearch 作为统一存储后端，全面支持 LightRAG 的所有四种存储类型。
[2026.03]🎯[新功能]：引入设置向导。支持通过 Docker 本地部署嵌入、重排序和存储后端。
[2025.11]🎯[新功能]：集成 RAGAS 用于评估和 Langfuse 用于追踪。更新 API 以在返回查询结果时附带检索到的上下文，支持上下文精确率指标。
[2025.10]🎯[可扩展性增强]：消除处理瓶颈，高效支持大规模数据集。
[2025.09]🎯[新功能]：提升 开源 LLM（如 Qwen3-30B-A3B）的知识图谱提取准确率。
[2025.08]🎯[新功能]：现已支持 重排序器（Reranker），显著提升混合查询的性能（设为默认查询模式）。
[2025.08]🎯[新功能]：新增 文档删除 功能，自动重新生成知识图谱以确保最佳查询性能。
[2025.06]🎯[新版本发布]：我们团队发布了 https://github.com/HKUDS/RAG-Anything%E2%80%94%E2%80%94%E4%B8%80%E4%B8%AA**%E4%B8%80%E4%BD%93%E5%8C%96%E5%A4%9A%E6%A8%A1%E6%80%81 RAG** 系统，可无缝处理文本、图像、表格和公式。
[2025.06]🎯[新功能]：LightRAG 现在通过 https://github.com/HKUDS/RAG-Anything 集成支持全面的多模态数据处理，实现跨多种格式（包括 PDF、图像、Office 文档、表格和公式）的无缝文档解析和 RAG 功能。详情请参阅新的 https://github.com/HKUDS/LightRAG/?tab=readme-ov-file#multimodal-document-processing-rag-anything-integration%E3%80%82
[2025.03]🎯[新功能]：LightRAG 现已支持引用功能，实现适当的来源归因和增强的文档可追溯性。
[2025.02]🎯[新功能]：现在可将 MongoDB 用作一体化存储解决方案，实现统一数据管理。
[2025.02]🎯[新版本发布]：我们团队发布了 https://github.com/HKUDS/VideoRAG%E2%80%94%E2%80%94%E4%B8%80%E4%B8%AA%E7%94%A8%E4%BA%8E%E7%90%86%E8%A7%A3%E8%B6%85%E9%95%BF%E4%B8%8A%E4%B8%8B%E6%96%87%E8%A7%86%E9%A2%91%E7%9A%84 RAG 系统。
[2025.01]🎯[新版本发布]：我们团队发布了 https://github.com/HKUDS/MiniRAG%EF%BC%8C%E9%80%9A%E8%BF%87%E5%B0%8F%E5%9E%8B%E6%A8%A1%E5%9E%8B%E7%AE%80%E5%8C%96 RAG 应用。
[2025.01]🎯现在可将 PostgreSQL 用作一体化存储解决方案进行数据管理。
[2024.11]🎯[新资源]：LightRAG 综合指南现已在 LearnOpenCV 上线——探索深入教程和最佳实践。非常感谢博客作者的杰出贡献！
[2024.11]🎯[新功能]：推出 LightRAG WebUI——一个直观的基于 Web 的仪表板界面，允许你插入、查询和可视化 LightRAG 知识。
[2024.11]🎯[新功能]：现在可 https://github.com/HKUDS/LightRAG?tab=readme-ov-file#using-neo4j-for-storage%E2%80%94%E2%80%94%E6%94%AF%E6%8C%81%E5%9B%BE%E6%95%B0%E6%8D%AE%E5%BA%93%E3%80%82
[2024.10]🎯[新功能]：我们添加了 LightRAG 介绍视频的链接——LightRAG 功能演示。感谢作者的出色贡献！
[2024.10]🎯[新渠道]：我们创建了 *** 频道!💬 欢迎加入我们的社区进行分享、讨论和协作！🎉🎉

算法流程图

图 1：LightRAG 索引流程图 - 图片说明：来源
图 2：LightRAG 检索与查询流程图 - 图片说明：来源

安装

[!NOTE] 你也可以根据偏好使用 pip，但推荐使用 uv 以获得更好的性能和更可靠的依赖管理。

[!NOTE] 📦 离线部署：对于离线或隔离环境，请参阅离线部署指南以获取预安装所有依赖项和缓存文件的说明。

安装 LightRAG 服务器

从 PyPI 安装

### 使用 uv 安装 LightRAG Server 作为工具（推荐）
uv tool install "lightrag-hku[api]"

### 或使用 pip
# python -m venv .venv
# source .venv/bin/activate # Windows 系统：.venv\Scripts\activate
# pip install "lightrag-hku[api]"

### 构建前端资源
cd lightrag_webui
bun install --frozen-lockfile
bun run build
cd ..

# 设置环境变量文件
# 通过从 GitHub 仓库根目录下载或从本地源码检出中复制获取 env.example 文件
cp env.example .env # 使用你的 LLM 和嵌入配置更新 .env 文件
# 启动服务器
lightrag-server

从源代码安装

git clone https://github.com/HKUDS/LightRAG.git
cd LightRAG

# 引导开发环境（推荐）
make dev
source .venv/bin/activate # 激活虚拟环境（Linux/macOS）
# Windows 系统：.venv\Scripts\activate

# make dev 会安装测试工具链以及完整的离线栈
# （API、存储后端和提供程序集成），然后构建前端。
# 启动服务器前运行 make env-base 或复制 env.example 到 .env。

# 使用 uv 的等效手动步骤
# 注意：uv sync 会在 .venv/ 中自动创建虚拟环境
uv sync --extra test --extra offline
source .venv/bin/activate # 激活虚拟环境（Linux/macOS）
# Windows 系统：.venv\Scripts\activate

### 或使用 pip 与虚拟环境
# python -m venv .venv
# source .venv/bin/activate # Windows 系统：.venv\Scripts\activate
# pip install -e ".[test,offline]"

# 构建前端资源
cd lightrag_webui
bun install --frozen-lockfile
bun run build
cd ..

# 设置环境变量文件
make env-base # 或：cp env.example .env 并手动更新
# 启动 API-WebUI 服务器
lightrag-server

使用 Docker Compose 启动 LightRAG 服务器

git clone https://github.com/HKUDS/LightRAG.git
cd LightRAG
cp env.example .env # 使用你的 LLM 和嵌入配置更新 .env 文件
# 修改 .env 中的 LLM 和嵌入设置
docker compose up

[!NOTE] LightRAG Docker 镜像的历史版本可在此处找到： https://github.com/HKUDS/LightRAG/pkgs/container/lightrag

[!NOTE] GitHub Actions 发布的官方 GHCR 镜像使用 GitHub OIDC 通过 Sigstore Cosign 进行签名。有关验证命令，请参见 docs/DockerDeployment.md。

使用设置工具创建 .env 文件

关于 LightRAG

轻量级、基于图的 RAG 框架

LightRAG 是一个轻量级知识图谱 RAG 框架，是 Microsoft GraphRAG 的高效替代方案。它采用双层架构来管理知识图谱（KGs）和向量嵌入，有效弥合了传统基于向量的 RAG 与基于图的 RAG 方法之间的差距。LightRAG 专为高可扩展性设计，解决了大规模图索引和检索中的关键挑战，包括计算开销大、响应速度慢以及增量更新成本高等问题。在支持大型数据集的同时，即使搭配 30B 开源大型语言模型（LLM），LightRAG 仍能提供极高的 RAG 质量。

特性与优势

深度上下文理解：通过图结构索引，LightRAG 捕获实体间复杂的语义依赖关系，克服传统基于块的检索方法中典型的上下文碎片化限制。在需要全局理解或逻辑推理的垂直领域（如***、***），其生成质量和上下文感知能力尤为突出。
卓越的全面性与多样性：LightRAG 的双层检索机制使其能够同时整合详细事实和抽象概念。这使系统在查询结果的全面性和多样性方面表现卓越，非常适合处理复杂的跨文档查询。
极高的检索效率与低成本：LightRAG 不依赖低效的社区报告或多跳推理来处理复杂查询。这大幅减少了索引和查询阶段所需的 LLM 调用次数，显著降低了响应延迟和 LLM 计算成本。
快速适应动态数据：LightRAG 支持无缝的增量知识库更新。新数据只需通过标准图索引 pipeline 生成局部图，然后通过集合合并直接整合到现有图中。此过程无需破坏原始结构或重建全局索引，确保在动态数据环境中的实时相关性。删除文档时，系统利用构建阶段的 LLM 缓存快速重建受影响的实体关系，极大提高了知识库更新效率。

多模态能力升级

从 v1.5 版本开始，LightRAG 正式引入了多模态文档的分析和检索能力：

多引擎文档解析：其文档处理 pipeline 支持 MinerU、Docling 和 Native 等解析引擎，能够高效提取文档中的文本、表格、公式和图像。
跨模态实体与关系映射：在统一框架内实现跨模态实体提取和关系映射，实现无缝的索引和查询。
增强的应用场景：全新的多模态处理 pipeline 显著提升了富含多模态内容的文档（如操作手册、学术论文）的 RAG 质量。

LightRAG API 服务器

LightRAG 服务器不仅提供基于 Web 的 UI 用于探索 LightRAG 功能，还提供全面的 REST API。有关 LightRAG 服务器的更多信息，请参阅 LightRAG Server。

文档处理管道配置

LightRAG 中的默认管道配置无法使系统发挥最佳性能。文档解析质量对文档索引和查询有很大影响。因此，我们建议配置管道以启用 MinerU 解析引擎并激活管道的图像分析功能。建议配置如下：

LIGHTRAG_PARSER=*:native-iteP,*:mineru-iteP,*:legacy-R

VLM_PROCESS_ENABLE=true
VLM_LLM_MODEL=

由于基于云的 MinerU 服务在使用量、文件大小和页数方面存在限制，建议使用本地部署的 MinerU。有关文件处理管道的配置详情，请参阅 FileProcessingPipeline.md

文件处理的并发优化

对于大规模文档处理，需要提高并发性。与文件并发处理相关的关键环境变量包括：

MAX_ASYNC_LLM/EXTRACT_ASYNC_LLM：控制 LLM 模型的最大并发数。
MAX_PARALLEL_INSERT：控制并行处理的最大文件数量。单个文件内的文本、表格、公式和图像处理也会并发进行。MAX_PARALLEL_INSERT 理想情况下应设置为 MAX_ASYNC_LLM 的约 1/3。
MAX_PARALLEL_PARSE_MINERU：控制 MinerU 解析的并行文件处理数量。
MAX_PARALLEL_PARSE_DOCLING：控制 Docling 解析的并行文件处理数量。
EMBEDDING_FUNC_MAX_ASYNC：控制嵌入模型的最大并发数。
EMBEDDING_BATCH_NUM：控制每个嵌入模型请求中包含的文本数量（每批嵌入数量）。增加此数值可显著减少对嵌入模型的 API 调用次数，并加快嵌入存储中的数据持久化速度。

# 示例配置
MAX_ASYNC_LLM=8
MAX_PARALLEL_INSERT=3
EMBEDDING_FUNC_MAX_ASYNC=16
EMBEDDING_BATCH_NUM=32

LightRAG SDK 示例代码

要开始使用 LightRAG 核心功能，请参考 examples 文件夹中的示例代码。此外，还提供了一个视频演示，指导您完成本地设置过程。如果您已拥有 OpenAI API 密钥，可以立即运行演示：

### 请在项目文件夹中运行演示代码
cd LightRAG
### 提供您的 OpenAI API 密钥
export OPENAI_API_KEY="sk-...your_opeai_key..."
### 下载查尔斯·狄更斯《圣诞颂歌》的演示文档
curl https://raw.githubusercontent.com/gusye1234/nano-graphrag/main/tests/mock_data.txt
> ./book.txt
### 运行演示代码
python examples/lightrag_openai_demo.py

有关流式响应实现示例，请参见 examples/lightrag_openai_compatible_demo.py。执行前，请确保相应修改示例代码中的 LLM 和嵌入模型配置。

[!NOTE] 运行演示程序时，请注意不同测试脚本可能使用不同的嵌入模型。如果切换到其他嵌入模型，必须清除数据目录（./dickens）；否则程序可能会出错。如果希望保留 LLM 缓存，可以在清除数据目录时保留 kv_store_llm_response_cache.json 文件。

[!NOTE] 官方仅支持 lightrag_openai_demo.py 和 lightrag_openai_compatible_demo.py 示例代码。其他示例文件为社区贡献，尚未经过全面测试和优化。

SDK 使用注意事项

有关 SDK 使用的详细说明，请参考 docs/ProgramingWithCore.md。部分 LightRAG 功能未通过 REST API 公开，仅可通过 SDK 访问。这些功能通常为实验性，可能与未来版本不兼容。

复现论文中的研究结果

在农业、计算机科学、***和混合领域，LightRAG 的性能始终优于 NaiveRAG、RQ-RAG、HyDE 和 GraphRAG。有关完整的评估方法、提示词和复现步骤，请参见 docs/Reproduce.md。

整体性能表

	农业		计算机科学		*******		混合
	NaiveRAG	LightRAG	NaiveRAG	LightRAG	NaiveRAG	LightRAG	NaiveRAG	LightRAG
全面性	32.4%	67.6%	38.4%	61.6%	16.4%	83.6%	38.8%	61.2%
多样性	23.6%	76.4%	38.0%	62.0%	13.6%	86.4%	32.4%	67.6%
赋能性	32.4%	67.6%	38.8%	61.2%	16.4%	83.6%	42.8%	57.2%
总体	32.4%	67.6%	38.8%	61.2%	15.2%	84.8%	40.0%	60.0%
	RQ-RAG	LightRAG	RQ-RAG	LightRAG	RQ-RAG	LightRAG	RQ-RAG	LightRAG
全面性	31.6%	68.4%	38.8%	61.2%	15.2%	84.8%	39.2%	60.8%
多样性	29.2%	70.8%	39.2%	60.8%	11.6%	88.4%	30.8%	69.2%
赋能性	31.6%	68.4%	36.4%	63.6%	15.2%	84.8%	42.4%	57.6%
总体	32.4%	67.6%	38.0%	62.0%	14.4%	85.6%	40.0%	60.0%
	HyDE	LightRAG	HyDE	LightRAG	HyDE	LightRAG	HyDE	LightRAG
全面性	26.0%	74.0%	41.6%	58.4%	26.8%	73.2%	40.4%	59.6%
多样性	24.0%	76.0%	38.8%	61.2%	20.0%	80.0%	32.4%	67.6%
赋能性	25.2%	74.8%	40.8%	59.2%	26.0%	74.0%	46.0%	54.0%
总体	24.8%	75.2%	41.6%	58.4%	26.4%	73.6%	42.4%	57.6%
	GraphRAG	LightRAG	GraphRAG	LightRAG	GraphRAG	LightRAG	GraphRAG	LightRAG
全面性	45.6%	54.4%	48.4%	51.6%	48.4%	51.6%	50.4%	49.6%
多样性	22.8%	77.2%	40.8%	59.2%	26.4%	73.6%	36.0%	64.0%
赋能性	41.2%	58.8%	45.2%	54.8%	43.6%	56.4%	50.8%	49.2%
总体	45.2%	54.8%	48.0%	52.0%	47.2%	52.8%	50.4%	49.6%

🔗 相关项目

生态系统与扩展

📸

RAG-Anything
多模态 RAG

🎥

VideoRAG
超长上下文视频 RAG

✨

MiniRAG
极简 RAG

⭐ Star History

🤝 贡献

我们欢迎各种形式的贡献——错误修复、新功能、文档改进等。
提交拉取请求前，请阅读我们的贡献指南。

感谢所有贡献者的宝贵贡献。

📖 引用

@article{guo2024lightrag,
title={LightRAG: Simple and Fast Retrieval-Augmented Generation},
author={Zirui Guo and Lianghao Xia and Yanhua Yu and Tu Ao and Chao Huang},
year={2024},
eprint={2410.05779},
archivePrefix={arXiv},
primaryClass={cs.IR}
}

⭐
感谢您关注 LightRAG！
⭐

轩辕镜像配置手册

按平台快速找到配置文档

一键安装

一键安装 Docker

Linux Docker 一键安装

AI

用 AI 使用轩辕镜像

agents.md · AI 对话 · 提示词

Docker

登录仓库拉取

登录认证 · 私有仓库

专属域名拉取

免登录 · 高速拉取

Linux

Docker 镜像配置

Windows / Mac

Docker Desktop 配置

MacOS OrbStack

OrbStack 容器

Apple Container

macOS 原生容器

Docker Compose

Compose 项目配置

NAS

群晖

Synology 配置

飞牛

fnOS 镜像配置

绿联

绿联 NAS

威联通

QNAP 配置

极空间

极空间 NAS

Unraid

Unraid NAS

企业仓库

其他仓库

ghcr · Quay · nvcr

Harbor 镜像源

Proxy Repository 对接

Portainer 镜像源

Registries 配置

Nexus 镜像源

Docker Proxy 缓存

开发工具

Dev Containers

VS Code 开发容器

Podman

Podman 配置指南

Singularity / Apptainer

HPC 科学计算容器

Kubernetes

K8s Containerd

Kubernetes · Containerd

K3s

轻量级集群

面板 / 网络

爱快路由

iKuai 镜像加速

宝塔面板

一键配置镜像源

需要其他帮助？请查看我们的常见问题Docker 镜像访问常见问题解答或提交工单

镜像拉取常见问题

功能

版本功能对比

功能对比 · 版本选择

支持的镜像仓库

Docker Hub · GCR · GHCR

新手拉取配置

docker search 限制

专属域名 · Hub 搜索

不支持 push

仅支持 pull · 不支持

拉取速度原因

带宽 · 缓存 · 冷热镜像

错误码

402 与流量用尽

402 · 流量包 · 充值

401 认证失败

401 · docker login

manifest unknown

标签错误 · 镜像不存在

410 Gone 排查

410 · Docker 升级

429 限流

免费版 · 专业版 · 企业版 · 请求频率

其他报错

DNS 超时

DNS 解析 · 网络超时

TLS 证书失败

no matching manifest（架构）

账号

失败是否计费

manifest · blob · 计费

申请开发票（企业 / 个人）

企业 · 个人 · 工单

修改登录密码

网站 · 仓库 · 重置

注销账户

工单 · 数据 · 注销

原理

mirrors 不生效

daemon.json · 重启

去掉域名前缀

docker tag · 重命名

指定架构拉取

ARM64 · AMD64 · 多架构

latest 与「最新」

digest · 版本号 · 标签

查看全部问题→

用户好评

来自真实用户的反馈，见证轩辕镜像的优质服务

oldzhang

运维工程师

Linux服务器

"Docker访问体验非常流畅，大镜像也能快速完成下载。"