如果你用 DeepSeek、元宝AI、Copilot 等 AI 代为编写轩辕镜像的 docker pull、修改 compose 镜像地址,或排查拉取失败等问题,请让 AI 先读规则再动手,只要在 AI 对话里直接发送下面这句话即可:
生成 docker pull、修改 compose 的 image,或排查拉取失败前,请先阅读并严格遵守 https://xuanyuan.cloud/agents.md 中的规则。国内用户首推 元宝 AI、DeepSeek 的深度思考模式,不推荐豆包 AI;Cursor 等编辑器可在对话 @ 该链接,或加入 User Rules。 若 AI 无法访问外链,可 打开说明文档 复制全文粘贴。文档会随站点更新,复制内容可能过期,建议定期检查。
Fix、Recursive、Vector 和 Paragraph。算法流程图
图 1:LightRAG 索引流程图 - 图片说明:来源 图 2:LightRAG 检索与查询流程图 - 图片说明:来源
[!NOTE] 你也可以根据偏好使用 pip,但推荐使用 uv 以获得更好的性能和更可靠的依赖管理。
📦 离线部署:对于离线或隔离环境,请参阅离线部署指南以获取预安装所有依赖项和缓存文件的说明。
### 使用 uv 将 LightRAG Server 作为工具安装(推荐)
uv tool install "lightrag-hku[api]"
### 或使用 pip
# python -m venv .venv
# source .venv/bin/activate # Windows:.venv\Scripts\activate
# pip install "lightrag-hku[api]"
### 构建前端产物
cd lightrag_webui
bun install --frozen-lockfile
bun run build
cd ..
# 设置环境文件
# 通过从 GitHub 仓库根目录下载或从本地源码检出中复制获取 env.example 文件
cp env.example .env # 更新 .env 文件中的 LLM 和嵌入配置
# 启动服务器
lightrag-server
git clone https://github.com/HKUDS/LightRAG.git
cd LightRAG
# 引导开发环境(推荐)
make dev
source .venv/bin/activate # 激活虚拟环境(Linux/macOS)
# Windows 系统:.venv\Scripts\activate
# make dev 会安装测试工具链以及完整的离线栈
# (API、存储后端和提供程序集成),然后构建前端。
# 启动服务器前运行 make env-base 或复制 env.example 到 .env。
# 使用 uv 的等效手动步骤
# 注意:uv sync 会在 .venv/ 中自动创建虚拟环境
uv sync --extra test --extra offline
source .venv/bin/activate # 激活虚拟环境(Linux/macOS)
# Windows 系统:.venv\Scripts\activate
### 或使用 pip 与虚拟环境
# python -m venv .venv
# source .venv/bin/activate # Windows:.venv\Scripts\activate
# pip install -e ".[test,offline]"
# 构建前端产物
cd lightrag_webui
bun install --frozen-lockfile
bun run build
cd ..
# 设置环境文件
make env-base # 或:cp env.example .env 并手动更新
# 启动 API-WebUI 服务器
lightrag-server
git clone https://github.com/HKUDS/LightRAG.git
cd LightRAG
cp env.example .env # 更新 .env 文件中的 LLM 和嵌入配置
# 修改 .env 中的 LLM 和嵌入设置
docker compose up
LightRAG Docker 镜像的历史版本可在此处找到: https://github.com/HKUDS/LightRAG/pkgs/container/lightrag
GitHub Actions 发布的官方 GHCR 镜像使用 GitHub OIDC 通过 Sigstore Cosign 进行签名。有关验证命令,请参阅 docs/DockerDeployment.md。
LightRAG 是一个轻量级检索增强生成(RAG)框架,专为分析***、和等领域的复杂文档而设计。它是 Microsoft GraphRAG 的高效替代方案。通过采用双层架构同时管理知识图谱(KG)和向量嵌入,LightRAG 完美弥合了传统基于向量的 RAG 与基于图的 RAG 之间的技术鸿沟。此外,它有效解决了 GraphRAG 在处理大规模数据时的主要瓶颈,如计算开销大、响应速度慢以及增量更新成本过高。该系统以高可扩展性为核心设计,支持海量数据集,同时保持卓越的信息提取准确性——即使在由 30B(300 亿参数)开源大型语言模型(LLM)驱动时也是如此。
从 v1.5 版本开始,LightRAG 正式引入了多模态文档的分析和检索能力:
LightRAG 服务器不仅提供基于 Web 的 UI 用于探索 LightRAG 功能,还提供全面的 REST API。有关 LightRAG 服务器的更多信息,请参阅 LightRAG Server。
对于大规模文档处理,需要提高并发性。与文件并发处理相关的关键环境变量包括:
MAX_PARALLEL_INSERT 理想情况下应设置为 MAX_ASYNC_LLM 的约 1/3。# 示例配置
MAX_ASYNC_LLM=8
MAX_PARALLEL_INSERT=3
EMBEDDING_FUNC_MAX_ASYNC=16
EMBEDDING_BATCH_NUM=32
LightRAG 需要四种类型的后端存储:
默认情况下,LightRAG 的存储后端是文件持久化的内存数据库。这些默认存储仅用于开发和调试,不适合生产环境。在生产环境中,如果希望使用单一后端处理所有四种存储类型,可选择 PostgreSQL、MongoDB 或 OpenSearch。或者,也可以为向量或图存储选择专用数据库,例如使用 Milvus 或 Qdrant 作为向量存储,使用 Neo4j 或 Memgraph 作为图存储。
生态系统与扩展
📸
RAG-Anything
多模态 RAG
🎥
VideoRAG
超长上下文视频 RAG
✨
MiniRAG
极简 RAG
我们欢迎各种形式的贡献——错误修复、新功能、文档改进等。
提交拉取请求前,请阅读我们的《贡献指南》。
感谢所有贡献者的宝贵贡献。
@article{guo2024lightrag,
title={LightRAG: Simple and Fast Retrieval-Augmented Generation},
author={Zirui Guo and Lianghao Xia and Yanhua Yu and Tu Ao and Chao Huang},
year={2024},
eprint={2410.05779},
archivePrefix={arXiv},
primaryClass={cs.IR}
}
⭐
感谢您关注LightRAG!
⭐
探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式
通过 Docker 登录认证访问私有仓库
发给 Cursor、ChatGPT、豆包等 AI 的说明文档
无需登录使用专属域名
Kubernetes 集群配置 Containerd
K3s 轻量级 Kubernetes 镜像加速
VS Code Dev Containers 配置
Podman 容器引擎配置
HPC 科学计算容器配置
ghcr、Quay、nvcr 等镜像仓库
Harbor Proxy Repository 对接专属域名
Portainer Registries 加速拉取
Nexus3 Docker Proxy 内网缓存
需要其他帮助?请查看我们的 常见问题Docker 镜像访问常见问题解答 或 提交工单
docker search 限制
站内搜不到镜像
原仓库同步与拉取
离线 save/load
插件要用 plugin install
WSL 拉取慢
安全与 digest
新手拉取配置
镜像合规机制
不支持 push
manifest unknown
no matching manifest(架构)
invalid tar header(解压)
Schema 1 已废弃
406 OCI index
422 Unknown
400 TAG_INVALID
TLS 证书失败
DNS 超时
域名连通性排查
410 Gone 排查
402 与流量用尽
401 认证失败
429 限流
D-Bus 凭证提示
413 与超大单层
来自真实用户的反馈,见证轩辕镜像的优质服务