ghcr.io/cinnamon/kotaemon:main-full Docker 镜像

ghcr.iolinux/amd64main-full大小: 5.55 GB更新于 2026年6月21日

让 AI 帮你使用轩辕镜像？ · 展开查看说明 · 点击收起说明

如果你使用 DeepSeek、元宝 AI、Copilot、ChatGPT 等 AI 工具，协助配置轩辕镜像、编写 docker pull 命令、修改 Docker Compose 镜像地址、配置镜像加速、排查镜像拉取失败、分析报错日志等问题，请先让 AI 阅读并遵守轩辕镜像的规则文档。

只需在 AI 对话中先发送下面这句话即可：

请先完整阅读并严格遵守以下文档中的全部规则与要求：

https://xuanyuan.cloud/agents.md

在未充分阅读并理解该文档前，不要生成任何命令、配置、修改建议、故障排查方案或技术回答。后续所有输出都必须严格以该文档中的规范为最高优先级执行。

查看 agents.md 用法指南与完整示范。国内用户首推元宝 AI、DeepSeek 的深度思考模式，不推荐豆包 AI；Cursor 等编辑器可在对话 @ 该链接，或加入 User Rules。若 AI 无法访问外链，可打开说明文档复制全文粘贴。文档会随站点更新，复制内容可能过期，建议定期检查。

kotaemon

一个开源、简洁且可定制的RAG UI，用于与您的文档对话。兼顾终端用户和开发者的需求而构建。

Live Demo #1 | Live Demo #2 | Online Install | Colab Notebook (Local RAG)

User Guide | Developer Guide | Feedback | Contact

简介

本项目为两类用户提供功能完善的RAG UI：一类是希望对自己的文档进行问答的终端用户，另一类是希望构建自己RAG流水线的开发者。

+----------------------------------------------------------------------------+
| 终端用户：使用基于 `kotaemon` 构建的应用的用户。 |
| （您使用的应用类似于上面演示中的应用） |
| +----------------------------------------------------------------+ |
| | 开发者：基于 `kotaemon` 进行构建的用户。 | |
| | （您的项目中包含 `import kotaemon` 语句） | |
| | +----------------------------------------------------+ | |
| | | 贡献者：致力于改进 `kotaemon` 的用户。 | | |
| | | （您向本仓库提交PR） | | |
| | +----------------------------------------------------+ | |
| +----------------------------------------------------------------+ |
+----------------------------------------------------------------------------+

面向终端用户

简洁简约的UI：一个用户友好的RAG问答界面。
支持多种LLM：兼容LLM API提供商（OpenAI、AzureOpenAI、Cohere等）和本地LLM（通过ollama和llama-cpp-python）。 ollama``llama-cpp-python- 轻松安装：简单的脚本助您快速开始使用。

面向开发者

RAG流水线框架：用于构建您自己的基于RAG的文档问答流水线的工具。
可定制UI：通过提供的基于Gradio构建的UI查看您的RAG流水线运行情况。
Gradio主题：如果您使用Gradio进行开发，可查看我们的主题：kotaemon-gradio-theme。

核心功能

托管您自己的文档问答（RAG）Web UI：支持多用户登录，将文件组织为私有/公开集合，协作并与他人分享您喜爱的对话。 Host your own document QA (RAG) web-UI: Support multi-user login, organize your files in private/public collections, collaborate and share your favorite chat with others.
管理您的LLM和嵌入模型：支持本地LLM和主流API提供商（OpenAI、Azure、Ollama、Groq）。 Organize your LLM & Embedding models: Support both local LLMs & popular API providers (OpenAI, Azure, Ollama, Groq).
混合RAG流水线：合理的默认RAG流水线，结合混合（全文+向量）检索器和重排序，确保最佳检索质量。 Hybrid RAG pipeline: Sane default RAG pipeline with hybrid (full-text & vector) retriever and re-ranking to ensure best retrieval quality.
多模态问答支持：对包含图表和表格的多个文档执行问答。支持多模态文档解析（UI上可选）。 Multi-modal QA support: Perform Question Answering on multiple documents with figures and tables support. Support multi-modal document parsing (selectable options on UI).
带文档预览的高级引用：系统默认提供详细引用，确保LLM答案的正确性。直接在浏览器内PDF查看器中查看引用（包括相关分数）并高亮显示。当检索流水线返回低相关性文章时发出警告。 Advanced citations with document preview: By default the system will provide detailed citations to ensure the correctness of LLM answers. View your citations (incl. relevant score) directly in the in-browser PDF viewer with highlights. Warning when retrieval pipeline return low relevant articles.
支持复杂推理方法：使用问题分解来回答复杂/多跳问题。支持基于智能体的推理，如ReAct、ReWOO等智能体。 Support complex reasoning methods: Use question decomposition to answer your complex/multi-hop question. Support agent-based reasoning with ReAct, ReWOO and other agents.

ReAct``ReWOO- 可配置的设置UI：您可以在UI上调整检索和生成过程的大多数重要方面（包括提示词）。 Configurable settings UI: You can adjust most important aspects of retrieval & generation process on the UI (incl. pro***s).

可扩展性：基于Gradio构建，您可以自由定制或添加任何UI元素。此外，我们旨在支持多种文档索引和检索策略。GraphRAG索引流水线作为示例提供。 Extensible: Being built on Gradio, you are free to customize or add any UI elements as you like. Also, we aim to support multiple strategies for document indexing & retrieval. GraphRAG indexing pipeline is provided as an example.

GraphRAG## 安装

[!NOTE] 如果您不是开发者，只是想使用该应用，请查阅我们易于遵循的《用户指南》。从最新发布版本下载.zip文件，以获取所有最新功能和错误修复。

If you are not a developer and just want to use the app, please check out our easy-to-follow User Guide. Download the .zip file from the latest release to get all the newest features and bug fixes.

.zip## 系统要求

Python >= 3.10
Docker：可选，如果使用Docker安装
Unstructured：如果您想处理除.pdf、.html、.mhtml和.xlsx之外的文档。安装步骤因操作系统而异。请访问链接并按照那里提供的具体说明操作。 .pdf``.html``.mhtml``.xlsx## 使用Docker（推荐）
我们支持Docker镜像的精简版（lite）和完整版（full）。完整版安装了unstructured的额外包，可支持更多文件类型（.doc、.docx等），但代价是更大的镜像体积。对于大多数用户，精简版在大多数情况下应该足够使用。

lite``full``full``unstructured``.doc``.docx``lite- 要使用完整版：

docker run \
-e GRADIO_SERVER_NAME=0.0.0.0 \
-e GRADIO_SERVER_PORT=7860 \
-v ./ktem_app_data:/app/ktem_app_data \
-p 7860:7860 -it --rm \
ghcr.io/cinnamon/kotaemon:main-full

To use the full version.

不使用 Docker

克隆仓库：

git clone https://github.com/Cinnamon/kotaemon
cd kotaemon

设置环境：
- 选项 1：使用 uv（推荐）

uv sync --python 3.10
  source .venv/bin/activate

选项 2：使用 conda

conda create -n kotaemon python=3.10
  conda activate kotaemon

  pip install -e "libs/kotaemon[all]"
  pip install -e "libs/ktem"

在项目根目录创建 .env 文件。以 .env.example 作为模板。.env 文件用于满足用户在启动应用前预配置模型的需求（例如在 HF Hub 上部署应用）。该文件仅在首次运行时用于填充数据库，后续运行将不再使用。
（可选）要启用浏览器内 PDF_JS 查看器，请下载 PDF_JS_DIST 并将其解压到 libs/ktem/ktem/assets/prebuilt。
启动 Web 服务器：

python app.py

应用将自动在浏览器中启动。
- 默认用户名和密码均为 admin。您可以直接通过 UI 设置其他用户。
检查“Resources”（资源）选项卡以及“LLMs and Embeddings”（LLM 和嵌入模型），确保您的 api_key 值已从 .env 文件正确设置。如果未设置，您可以在此处进行设置。

设置 GraphRAG

官方 MS GraphRAG 索引仅适用于 OpenAI 或 Ollama API。我们建议大多数用户使用 NanoGraphRAG 实现，以便与 Kotaemon 直接集成。

安装 nano-GraphRAG：

pip install nano-graphrag

安装 nano-graphrag 可能会导致版本冲突，参见此问题。快速修复：

pip uninstall hnswlib chroma-hnswlib && pip install chroma-hnswlib

使用 USE_NANO_GRAPHRAG=true 环境变量启动 Kotaemon。
在“Resources”（资源）设置中设置您的默认 LLM 和嵌入模型，NanoGraphRAG 将自动识别这些设置。
安装 LightRAG：

pip install git+https://github.com/HKUDS/LightRAG.git

安装 LightRAG 可能会导致版本冲突，参见此问题。快速修复：

pip uninstall hnswlib chroma-hnswlib && pip install chroma-hnswlib

使用 USE_LIGHTRAG=true 环境变量启动 Kotaemon。
在“Resources”（资源）设置中设置您的默认 LLM 和嵌入模型，LightRAG 将自动识别这些设置。
非 Docker 安装：如果不使用 Docker，请使用以下命令安装 GraphRAG：pip install "graphrag Retrieval Settings -> File loader

自定义应用

默认情况下，所有应用数据存储在 ./ktem_app_data 文件夹中。您可以备份或复制此文件夹，将安装迁移到新机器。
对于高级用户或特定用例，您可以自定义以下文件：
- flowsettings.py
- .env

flowsettings.py

此文件包含应用的配置。您可以以此处的示例作为起点。

# setup your preferred document store (with full-text search capabilities)
KH_DOCSTORE=(Elasticsearch | LanceDB | SimpleFileDocumentStore)

.env

.env 文件提供了另一种配置模型和凭据的方式。

或者，你可以通过 .env 文件配置模型，其中包含连接 LLM 所需的信息。该文件位于应用程序的文件夹中。如果没有看到此文件，可以创建一个。

目前支持以下提供商：

OpenAI

在 .env 文件中，设置 OPENAI_API_KEY 变量并填入你的 OpenAI API 密钥，以启用对 OpenAI 模型的访问。还有其他可修改的变量，请根据你的情况进行编辑。否则，默认参数对大多数人来说应该适用。

OPENAI_API_BASE=https://api.openai.com/v1
OPENAI_API_KEY=
OPENAI_CHAT_MODEL=gpt-3.5-turbo
OPENAI_EMBEDDINGS_MODEL=text-embedding-ada-002

Azure OpenAI

对于通过 Azure 平台使用的 OpenAI 模型，你需要提供 Azure 端点和 API 密钥。根据 Azure 开发环境的设置方式，你可能还需要提供聊天模型和嵌入模型的部署名称。

AZURE_OPENAI_ENDPOINT=
AZURE_OPENAI_API_KEY=
OPENAI_API_VERSION=2024-02-15-preview
AZURE_OPENAI_CHAT_DEPLOYMENT=gpt-35-turbo
AZURE_OPENAI_EMBEDDINGS_DEPLOYMENT=text-embedding-ada-002

Local Models

Using ollama OpenAI compatible server:

安装 ollama 并启动应用程序。
拉取模型，例如：

ollama pull llama3.1:8b
  ollama pull nomic-embed-text

在 Web UI 上设置模型名称并设为默认。

Using *** with llama-cpp-python

你可以从 Hugging Face Hub 搜索并下载本地运行的 LLM。目前支持以下模型格式：***。

你应选择大小小于设备内存且留出约 2 GB 空间的模型。例如，如果你总共有 16 GB RAM，其中 12 GB 可用，则应选择最多占用 10 GB RAM 的模型。更大的模型通常生成效果更好，但处理时间也更长。

以下是一些推荐模型及其内存占用大小：

Qwen1.5-1.8B-Chat-***：约 2 GB

在 Web UI 上添加新的 LlamaCpp 模型并提供模型名称。

轩辕镜像配置手册

按平台快速找到配置文档

一键安装

一键安装 Docker

Linux Docker 一键安装

AI

用 AI 使用轩辕镜像

agents.md · AI 对话 · 提示词

Docker

登录仓库拉取

登录认证 · 私有仓库

专属域名拉取

免登录 · 高速拉取

Linux

Docker 镜像配置

Windows / Mac

Docker Desktop 配置

MacOS OrbStack

OrbStack 容器

Apple Container

macOS 原生容器

Docker Compose

Compose 项目配置

NAS

群晖

Synology 配置

飞牛

fnOS 镜像配置

绿联

绿联 NAS

威联通

QNAP 配置

极空间

极空间 NAS

Unraid

Unraid NAS

企业仓库

其他仓库

ghcr · Quay · nvcr

Harbor 镜像源

Proxy Repository 对接

Portainer 镜像源

Registries 配置

Nexus 镜像源

Docker Proxy 缓存

开发工具

Dev Containers

VS Code 开发容器

Podman

Podman 配置指南

Singularity / Apptainer

HPC 科学计算容器

Kubernetes

K8s Containerd

Kubernetes · Containerd

K3s

轻量级集群

面板 / 网络

爱快路由

iKuai 镜像加速

宝塔面板

一键配置镜像源

需要其他帮助？请查看我们的常见问题Docker 镜像访问常见问题解答或提交工单

镜像拉取常见问题

功能

版本功能对比

功能对比 · 版本选择

支持的镜像仓库

Docker Hub · GCR · GHCR

新手拉取配置

docker search 限制

专属域名 · Hub 搜索

不支持 push

仅支持 pull · 不支持

拉取速度原因

带宽 · 缓存 · 冷热镜像

错误码

402 与流量用尽

402 · 流量包 · 充值

401 认证失败

401 · docker login

manifest unknown

标签错误 · 镜像不存在

410 Gone 排查

410 · Docker 升级

429 限流

免费版 · 专业版 · 企业版 · 请求频率

其他报错

DNS 超时

DNS 解析 · 网络超时

TLS 证书失败

no matching manifest（架构）

账号

失败是否计费

manifest · blob · 计费

申请开发票（企业 / 个人）

企业 · 个人 · 工单

修改登录密码

网站 · 仓库 · 重置

注销账户

工单 · 数据 · 注销

原理

mirrors 不生效

daemon.json · 重启

去掉域名前缀

docker tag · 重命名

指定架构拉取

ARM64 · AMD64 · 多架构

latest 与「最新」

digest · 版本号 · 标签

查看全部问题→

用户好评

来自真实用户的反馈，见证轩辕镜像的优质服务

oldzhang

运维工程师

Linux服务器

"Docker访问体验非常流畅，大镜像也能快速完成下载。"