ghcr.io/hkuds/lightrag:v1.5.0 Docker 镜像

热门搜索:

ghcr.iolinux/amd64v1.5.0大小: 未知更新于 2026年6月6日

让 AI 帮你使用轩辕镜像？ · 展开查看说明

如果你用 DeepSeek、元宝AI、Copilot 等 AI 代为编写轩辕镜像的 docker pull、修改 compose 镜像地址，或排查拉取失败等问题，请让 AI 先读规则再动手，只要在 AI 对话里直接发送下面这句话即可：

生成 docker pull、修改 compose 的 image，或排查拉取失败前，请先阅读并严格遵守 https://xuanyuan.cloud/agents.md 中的规则。

国内用户首推元宝 AI、DeepSeek 的深度思考模式，不推荐豆包 AI；Cursor 等编辑器可在对话 @ 该链接，或加入 User Rules。若 AI 无法访问外链，可打开说明文档复制全文粘贴。文档会随站点更新，复制内容可能过期，建议定期检查。

🚀 LightRAG：简单快速的检索增强生成

🎉 新闻

[2026.05]🎯[New Feature]: 将 RagAnything 合并至 LightRAG🎉。通过 MinerU / Docling 服务实现多模态内容解析与提取。
[2026.05]🎯[New Feature]: 引入四种可选文本分块策略：Fix、Recursive、Vector 和 Paragraph。
[2026.05]🎯[New Feature]: 支持角色特定 LLM 配置，4 种 distinct 角色：EXTRACT、QUERY、KEYWORDS 和 VLM，具备独立 LLM 设置。
[2026.03]🎯[New Feature]: 集成 OpenSearch 作为统一存储后端，全面支持 LightRAG 的所有四种存储类型。
[2026.03]🎯[New Feature]: 引入设置向导。支持通过 Docker 本地部署嵌入、重排序和存储后端。
[2025.11]🎯[New Feature]: 集成 RAGAS 用于评估和 Langfuse 用于追踪。更新 API 以在返回查询结果时附带检索到的上下文，支持上下文精确率指标。
[2025.10]🎯[Scalability Enhancement]: 消除处理瓶颈，以高效支持大规模数据集。
[2025.09]🎯[New Feature] 提升开源 LLM（如 Qwen3-30B-A3B）的知识图谱提取准确性。
[2025.08]🎯[New Feature] 现已支持重排序器（Reranker），显著提升混合查询的性能（设为默认查询模式）。
[2025.08]🎯[New Feature] 新增文档删除功能，配合自动知识图谱（KG）再生，确保最佳查询性能。
[2025.06]🎯[New Release] 我们团队发布了 https://github.com/HKUDS/RAG-Anything%E2%80%94%E2%80%94%E4%B8%80%E4%B8%AA**%E4%B8%80%E4%BD%93%E5%8C%96%E5%A4%9A%E6%A8%A1%E6%80%81 RAG** 系统，可无缝处理文本、图像、表格和公式。
[2025.06]🎯[New Feature] LightRAG 现在通过 https://github.com/HKUDS/RAG-Anything 集成支持全面的多模态数据处理，实现跨多种格式（包括 PDF、图像、Office 文档、表格和公式）的无缝文档解析和 RAG 能力。详情请参阅新的 https://github.com/HKUDS/LightRAG/?tab=readme-ov-file#multimodal-document-processing-rag-anything-integration%E3%80%82
[2025.03]🎯[New Feature] LightRAG 现已支持引用功能，实现适当的来源归因和增强的文档可追溯性。
[2025.02]🎯[New Feature] 现在可将 MongoDB 用作一体化存储解决方案，实现统一数据管理。
[2025.02]🎯[New Release] 我们团队发布了 https://github.com/HKUDS/VideoRAG%E2%80%94%E2%80%94%E4%B8%80%E4%B8%AA%E7%94%A8%E4%BA%8E%E7%90%86%E8%A7%A3%E8%B6%85%E9%95%BF%E4%B8%8A%E4%B8%8B%E6%96%87%E8%A7%86%E9%A2%91%E7%9A%84 RAG 系统。
[2025.01]🎯[New Release] 我们团队发布了 https://github.com/HKUDS/MiniRAG%EF%BC%8C%E9%80%9A%E8%BF%87%E5%B0%8F%E5%9E%8B%E6%A8%A1%E5%9E%8B%E7%AE%80%E5%8C%96 RAG 应用。
[2025.01]🎯现在可将 PostgreSQL 用作一体化存储解决方案进行数据管理。
[2024.11]🎯[New Resource] 全面的 LightRAG 指南现已在 LearnOpenCV 上线——探索深入教程和最佳实践。非常感谢博客作者的杰出贡献！
[2024.11]🎯[New Feature] 推出 LightRAG WebUI——一个直观的基于 Web 的仪表板界面，允许你插入、查询和可视化 LightRAG 知识。
[2024.11]🎯[New Feature] 现在可https://github.com/HKUDS/LightRAG?tab=readme-ov-file#using-neo4j-for-storage%E2%80%94%E2%80%94%E6%94%AF%E6%8C%81%E5%9B%BE%E6%95%B0%E6%8D%AE%E5%BA%93%E3%80%82
[2024.10]🎯[New Feature] 我们添加了 LightRAG 介绍视频的链接——LightRAG 功能演示。感谢作者的杰出贡献！
[2024.10]🎯[New Channel] 我们创建了 *** 频道!💬 欢迎加入我们的社区进行分享、讨论和协作！ 🎉🎉

算法流程图

图 1：LightRAG 索引流程图 - 图片说明：来源 图 2：LightRAG 检索与查询流程图 - 图片说明：来源

安装

[!NOTE] 你也可以根据偏好使用 pip，但推荐使用 uv 以获得更好的性能和更可靠的依赖管理。

📦 离线部署：对于离线或隔离环境，请参阅离线部署指南以获取预安装所有依赖项和缓存文件的说明。

安装 LightRAG 服务器

从 PyPI 安装

### 使用 uv 将 LightRAG Server 作为工具安装（推荐）
 uv tool install "lightrag-hku[api]"

### 或使用 pip
 # python -m venv .venv
 # source .venv/bin/activate # Windows：.venv\Scripts\activate
 # pip install "lightrag-hku[api]"

### 构建前端产物
 cd lightrag_webui
 bun install --frozen-lockfile
 bun run build
 cd ..

 # 设置环境文件
 # 通过从 GitHub 仓库根目录下载或从本地源码检出中复制获取 env.example 文件
 cp env.example .env # 更新 .env 文件中的 LLM 和嵌入配置
 # 启动服务器
 lightrag-server

从源码安装

git clone https://github.com/HKUDS/LightRAG.git
 cd LightRAG

 # 引导开发环境（推荐）
 make dev
 source .venv/bin/activate # 激活虚拟环境（Linux/macOS）
 # Windows 系统：.venv\Scripts\activate

 # make dev 会安装测试工具链以及完整的离线栈
 # （API、存储后端和提供程序集成），然后构建前端。
 # 启动服务器前运行 make env-base 或复制 env.example 到 .env。

 # 使用 uv 的等效手动步骤
 # 注意：uv sync 会在 .venv/ 中自动创建虚拟环境
 uv sync --extra test --extra offline
 source .venv/bin/activate # 激活虚拟环境（Linux/macOS）
 # Windows 系统：.venv\Scripts\activate

### 或使用 pip 与虚拟环境
 # python -m venv .venv
 # source .venv/bin/activate # Windows：.venv\Scripts\activate
 # pip install -e ".[test,offline]"

 # 构建前端产物
 cd lightrag_webui
 bun install --frozen-lockfile
 bun run build
 cd ..

 # 设置环境文件
 make env-base # 或：cp env.example .env 并手动更新
 # 启动 API-WebUI 服务器
 lightrag-server

使用 Docker Compose 启动 LightRAG 服务器

git clone https://github.com/HKUDS/LightRAG.git
 cd LightRAG
 cp env.example .env # 更新 .env 文件中的 LLM 和嵌入配置
 # 修改 .env 中的 LLM 和嵌入设置
 docker compose up

LightRAG Docker 镜像的历史版本可在此处找到： https://github.com/HKUDS/LightRAG/pkgs/container/lightrag

GitHub Actions 发布的官方 GHCR 镜像使用 GitHub OIDC 通过 Sigstore Cosign 进行签名。有关验证命令，请参阅 docs/DockerDeployment.md。

使用设置工具创建 .env 文件

关于 LightRAG

轻量级、基于图的 RAG 框架

LightRAG 是一个轻量级检索增强生成（RAG）框架，专为分析***、和等领域的复杂文档而设计。它是 Microsoft GraphRAG 的高效替代方案。通过采用双层架构同时管理知识图谱（KG）和向量嵌入，LightRAG 完美弥合了传统基于向量的 RAG 与基于图的 RAG 之间的技术鸿沟。此外，它有效解决了 GraphRAG 在处理大规模数据时的主要瓶颈，如计算开销大、响应速度慢以及增量更新成本过高。该系统以高可扩展性为核心设计，支持海量数据集，同时保持卓越的信息提取准确性——即使在由 30B（300 亿参数）开源大型语言模型（LLM）驱动时也是如此。

特性与优势

深度上下文理解：通过图结构索引，LightRAG 捕获实体间复杂的语义依赖关系，克服了传统基于块的检索方法中典型的上下文碎片化限制。在需要全局理解或逻辑推理的垂直领域（如***、***），其生成质量和上下文感知能力尤为突出。
卓越的全面性与多样性：LightRAG 的双层检索机制允许同时整合详细事实和抽象概念。这使系统在查询结果的全面性和多样性方面表现卓越，非常适合处理复杂的跨文档查询。
极致的检索效率与低成本：LightRAG 不依赖低效的社区报告或多跳推理来处理复杂查询。这大幅减少了索引和查询阶段所需的 LLM 调用次数，显著降低了响应延迟和 LLM 计算成本。
快速适应动态数据：LightRAG 支持无缝的增量知识库更新。新数据只需通过标准图索引 pipeline 生成局部图，然后通过集合合并直接整合到现有图中。此过程无需破坏原始结构或重建全局索引，确保在动态数据环境中的实时相关性。删除文档时，系统利用构建阶段的 LLM 缓存快速重建受影响的实体关系，极大提高了知识库更新效率。

多模态能力升级

从 v1.5 版本开始，LightRAG 正式引入了多模态文档的分析和检索能力：

多引擎文档解析：其文档处理 pipeline 支持 MinerU、Docling 和 Native 等解析引擎，能够高效提取文档中的文本、表格、公式和图像。
跨模态实体与关系映射：在统一框架内实现跨模态实体提取和关系映射，实现无缝索引和查询。
增强的应用场景：全新的多模态处理 pipeline 显著提升了富含多模态内容的文档（如操作手册和学术论文）的 RAG 质量。

LightRAG API 服务器

LightRAG 服务器不仅提供基于 Web 的 UI 用于探索 LightRAG 功能，还提供全面的 REST API。有关 LightRAG 服务器的更多信息，请参阅 LightRAG Server。

文件处理的并发优化

对于大规模文档处理，需要提高并发性。与文件并发处理相关的关键环境变量包括：

MAX_ASYNC_LLM/EXTRACT_ASYNC_LLM：控制LLM模型的最大并发数。
MAX_PARALLEL_INSERT：控制并行处理的最大文件数量。单个文件内的文本、表格、公式和图像处理也会并发进行。MAX_PARALLEL_INSERT 理想情况下应设置为 MAX_ASYNC_LLM 的约 1/3。
MAX_PARALLEL_PARSE_MINERU：控制 MinerU 解析的并行文件数量。
MAX_PARALLEL_PARSE_DOCLING：控制 Docling 解析的并行文件数量。
EMBEDDING_FUNC_MAX_ASYNC：控制嵌入模型的最大并发数。
EMBEDDING_BATCH_NUM：控制每个嵌入模型请求中包含的文本数量（每批嵌入数）。增加此数值可显著减少对嵌入模型的 API 调用次数，并加快嵌入存储中的数据持久化速度。

# 示例配置
MAX_ASYNC_LLM=8
MAX_PARALLEL_INSERT=3
EMBEDDING_FUNC_MAX_ASYNC=16
EMBEDDING_BATCH_NUM=32

选择后端存储

LightRAG 需要四种类型的后端存储：

KV_STORAGE：用于保存 LLM 响应缓存、文本分块结果、实体关系提取结果等。
VECTOR_STORAGE：用于存储文本块、实体和关系的向量信息。
GRAPH_STORAGE：用于保存知识图谱。
DOC_STATUS_STORAGE：用于存储文档列表。

默认情况下，LightRAG 的存储后端是文件持久化的内存数据库。这些默认存储仅用于开发和调试，不适合生产环境。在生产环境中，如果希望使用单一后端处理所有四种存储类型，可选择 PostgreSQL、MongoDB 或 OpenSearch。或者，也可以为向量或图存储选择专用数据库，例如使用 Milvus 或 Qdrant 作为向量存储，使用 Neo4j 或 Memgraph 作为图存储。

🔗 相关项目

生态系统与扩展

📸

RAG-Anything
多模态 RAG

🎥

VideoRAG
超长上下文视频 RAG

✨

MiniRAG
极简 RAG

⭐ 星标历史

🤝 贡献

我们欢迎各种形式的贡献——错误修复、新功能、文档改进等。
提交拉取请求前，请阅读我们的《贡献指南》。

感谢所有贡献者的宝贵贡献。

📖 引用

@article{guo2024lightrag,
title={LightRAG: Simple and Fast Retrieval-Augmented Generation},
author={Zirui Guo and Lianghao Xia and Yanhua Yu and Tu Ao and Chao Huang},
year={2024},
eprint={2410.05779},
archivePrefix={arXiv},
primaryClass={cs.IR}
}

⭐
感谢您关注LightRAG！
⭐

轩辕镜像配置手册

探索更多轩辕镜像的使用方法，找到最适合您系统的配置方式

Docker 配置

登录仓库拉取

通过 Docker 登录认证访问私有仓库

用 AI 使用轩辕镜像

发给 Cursor、ChatGPT、豆包等 AI 的说明文档

专属域名拉取

无需登录使用专属域名

K8s Containerd

Kubernetes 集群配置 Containerd

K3s

K3s 轻量级 Kubernetes 镜像加速

Dev Containers

VS Code Dev Containers 配置

Podman

Podman 容器引擎配置

Singularity/Apptainer

HPC 科学计算容器配置

其他仓库配置

ghcr、Quay、nvcr 等镜像仓库

Harbor 镜像源配置

Harbor Proxy Repository 对接专属域名

Portainer 镜像源配置

Portainer Registries 加速拉取

Nexus 镜像源配置

Nexus3 Docker Proxy 内网缓存

系统配置

Linux

在 Linux 系统配置镜像服务

Windows/Mac

在 Docker Desktop 配置镜像

MacOS OrbStack

MacOS OrbStack 容器配置

Docker Compose

Docker Compose 项目配置

NAS 设备

群晖

Synology 群晖 NAS 配置

飞牛

飞牛 fnOS 系统配置镜像

绿联

绿联 NAS 系统配置镜像

威联通

QNAP 威联通 NAS 配置

极空间

极空间 NAS 系统配置服务

网络设备

爱快路由

爱快 iKuai 路由系统配置

宝塔面板

在宝塔面板一键配置镜像

需要其他帮助？请查看我们的常见问题Docker 镜像访问常见问题解答或提交工单

镜像拉取常见问题

使用与功能问题

配置了专属域名后，docker search 为什么会报错？

docker search 限制

Docker Hub 上有的镜像，为什么在轩辕镜像网站搜不到？

站内搜不到镜像

轩辕镜像是否实时全量同步原仓库的所有镜像？

原仓库同步与拉取

机器不能直连外网时，怎么用 docker save / load 迁镜像？

离线 save/load

docker pull 拉插件报错（plugin v1+json）怎么办？

插件要用 plugin install

WSL 里 Docker 拉镜像特别慢，怎么排查和优化？

WSL 拉取慢

轩辕镜像安全吗？如何用 digest 校验镜像没被篡改？

安全与 digest

第一次用轩辕镜像拉 Docker 镜像，要怎么登录和配置？

新手拉取配置

轩辕镜像合规吗？轩辕镜像的合规是怎么做的？

镜像合规机制

轩辕镜像支持 docker push 上传本地镜像吗？

不支持 push

错误码与失败问题

docker pull 提示 manifest unknown 怎么办？

manifest unknown

docker pull 提示 no matching manifest 怎么办？

no matching manifest（架构）

镜像已拉取完成，却提示 invalid tar header 或 failed to register layer 怎么办？

invalid tar header（解压）

拉取老镜像提示 Schema 1 已废弃怎么办？

Schema 1 已废弃

Docker 拉取出现 406 或 OCI index 不支持怎么办？

406 OCI index

docker pull 出现 422 Unknown 怎么办？

422 Unknown

拉取镜像提示 TAG_INVALID 或无效标签（400）怎么办？

400 TAG_INVALID

Docker pull 时 HTTPS / TLS 证书验证失败怎么办？

TLS 证书失败

Docker pull 时 DNS 解析超时或连不上仓库怎么办？

DNS 超时

docker 无法连接轩辕镜像域名怎么办？

域名连通性排查

Docker 拉取出现 410 Gone 怎么办？

410 Gone 排查

出现 402 或「流量用尽」提示怎么办？

402 与流量用尽

Docker 拉取提示 UNAUTHORIZED（401）怎么办？

401 认证失败

遇到 429 Too Many Requests（请求太频繁）怎么办？

429 限流

docker login 提示 Cannot autolaunch D-Bus，还算登录成功吗？

D-Bus 凭证提示

为什么会出现「单层超过 20GB」或 413，无法加速拉取？

413 与超大单层

账号 / 计费 / 权限

轩辕镜像免费版和专业版有什么区别？

免费版与专业版区别

轩辕镜像支持哪些 Docker 镜像仓库？

支持的镜像仓库

镜像拉取失败还会不会扣流量？

失败是否计费

麒麟 V10 / 统信 UOS 提示 KYSEC 权限不够怎么办？

KYSEC 拦截脚本

如何在轩辕镜像申请开发票？

申请开发票（企业 / 个人）

怎么修改轩辕镜像的网站登录和仓库登录密码？

修改登录密码

如何注销轩辕镜像账户？要注意什么？

注销账户

配置与原理类

写了 registry-mirrors，为什么还是走官方或仍然报错？

mirrors 不生效

怎么用 docker tag 去掉镜像名里的轩辕域名前缀？

去掉域名前缀

如何拉取指定 CPU 架构的镜像（如 ARM64、AMD64）？

指定架构拉取

用轩辕镜像拉镜像时快时慢，常见原因有哪些？

拉取速度原因

为什么拉取镜像的 :latest 标签，拿到的往往不是「最新」镜像？

latest 与「最新」

查看全部问题→

用户好评

来自真实用户的反馈，见证轩辕镜像的优质服务

oldzhang

运维工程师

Linux服务器

"Docker访问体验非常流畅，大镜像也能快速完成下载。"