LLM 的聊天界面。这是一个 SvelteKit 应用,为 hf.co/chat 上的 HuggingChat 应用提供支持。
Chat UI 仅通过 OPENAI_BASE_URL 和 /models 端点支持与 OpenAI 兼容的 API。特定提供商的集成(旧版 MODELS 环境变量、GGUF 发现、嵌入、网络搜索助手等)已被移除,但任何支持 OpenAI 协议的服务(llama.cpp server、Ollama、OpenRouter 等)默认均可使用。
OPENAI_BASE_URL、/models、MODELS
旧版本仍可在 legacy 分支获取
Chat UI 仅支持与 OpenAI 兼容的 API。最快的运行方式是使用 Hugging Face Inference Providers 路由器加上您的个人 Hugging Face 访问令牌。
步骤 1 – 创建 .env.local:
OPENAI_BASE_URL=https://router.huggingface.co/v1
OPENAI_API_KEY=hf_************************
OPENAI_API_KEY 可来自您计划调用的任何与 OpenAI 兼容的端点。选择与您的设置匹配的组合,并将值放入 .env.local:
.env
步骤 2 – 安装并启动开发服务器:
git clone https://github.com/huggingface/chat-ui
cd chat-ui
npm install
npm run dev -- --open
现在您已在本地运行 Chat UI。打开浏览器开始聊天。
聊天历史、用户、设置、文件和统计数据均存储在 MongoDB 中。您可以将 Chat UI 指向任何 MongoDB 6/7 部署。
对于快速本地开发,您可以跳过此部分。当未设置 MONGODB_URL 时,Chat UI 会回退到持久化到 ./db 的嵌入式 MongoDB。
MONGODB_URL、./db
0.0.0.0/0)添加到网络访问列表。.env.local 中的 MONGODB_URL。保留默认的 MONGODB_DB_NAME=chat-ui 或根据环境修改。Atlas 可将 MongoDB 部署在您的笔记本电脑之外,非常适合团队或云部署。
如果您希望在容器中运行 MongoDB:
docker run -d -p 27017:27017 --name mongo-chatui mongo:latest
然后在 .env.local 中设置 MONGODB_URL=mongodb://localhost:27017。
配置环境变量后,使用以下命令启动 Chat UI:
npm install
npm run dev
开发服务器默认监听 http://localhost:5173。生产构建使用 npm run build / npm run preview。
Chat UI 可以调用由模型上下文协议(MCP)服务器公开的工具,并使用 OpenAI 函数调用将结果反馈给模型。您可以通过环境变量预配置受信任的服务器,允许用户添加自己的服务器,还可以选择让 Omni 路由器自动选择支持工具的模型。
# 服务器的 JSON 数组:名称、URL、可选标头
MCP_SERVERS=[
{"name": "Web Search (Exa)", "url": "https://mcp.exa.ai/mcp"},
{"name": "Hugging Face MCP Login", "url": "https://hf.co/mcp?login"}
]
# 当该服务器条目中未设置 Authorization 标头时,将已登录用户的 Hugging Face 令牌转发到官方 HF MCP 登录端点
MCP_FORWARD_HF_USER_TOKEN=true
LLM_ROUTER_ENABLE_TOOLS=true 并通过 LLM_ROUTER_TOOLS_MODEL= 选择支持工具的目标。LLM_ROUTER_ENABLE_TOOLS=true
LLM_ROUTER_TOOLS_MODEL=
要创建应用的生产版本:
npm run build
您可以使用 npm run preview 预览生产构建。
npm run preview
要部署应用,您可能需要为目标环境安装适配器。
要部署应用,您可能需要为目标环境安装适配器。
Chat UI 可使用本地启发式算法执行服务器端智能路由——无需调用单独的路由服务或选择模型。UI 公开一个名为“Omni”(可配置)的虚拟模型别名,选择该别名后,系统会为每条消息选择最佳路由/模型:图像输入走 multimodal 路由,启用 MCP 工具的请求走 agentic 路由,其他所有请求走 default 路由。
LLM_ROUTER_ROUTES_PATH 提供路由策略 JSON。此分支未附带示例文件,因此您必须将该变量指向自己创建的 JSON 数组(例如,在项目中提交一个类似 config/routes.chat.json 的文件)。每个路由条目需包含 name、description、primary_model 以及可选的 fallback_models。路由器可识别路由名称 default、multimodal 和 agentic。LLM_ROUTER_DEFAULT_ROUTE 配置(默认值:default)。如果所选路由的所有模型均失败,调用将回退到 LLM_ROUTER_FALLBACK_MODEL。PUBLIC_LLM_ROUTER_ALIAS_ID(默认 omni)、PUBLIC_LLM_ROUTER_DISPLAY_NAME(默认 Omni)以及可选的 PUBLIC_LLM_ROUTER_LOGO_URL。在 UI 中选择 Omni 后,Chat UI 将:
OPENAI_BASE_URL 从所选模型流式传输。发生错误时,系统会按顺序尝试路由回退模型,然后尝试 LLM_ROUTER_FALLBACK_MODEL。工具和多模态快捷方式:
LLM_ROUTER_ENABLE_MULTIMODAL=true 且用户发送图像,路由器将绕过策略文件并使用 LLM_ROUTER_MULTIMODAL_MODEL 中指定的模型。路由名称:multimodal。LLM_ROUTER_ENABLE_TOOLS=true 且用户至少启用了一个 MCP 服务器,路由器将绕过策略文件并使用 LLM_ROUTER_TOOLS_MODEL。如果该模型缺失或配置错误,将回退到启发式路由。路由名称:agentic。Chat UI 可调用模型上下文协议(MCP)服务器公开的工具,并使用 OpenAI 函数调用将结果反馈给模型。您可以通过环境变量预配置受信任的服务器,允许用户添加自己的服务器,还可选择让 Omni 路由器自动选择支持工具的模型。
配置服务器(所有用户的基础列表):
# 服务器 JSON 数组:name、url、可选 headers
MCP_SERVERS=[
{"name": "Web Search (Exa)", "url": "https://mcp.exa.ai/mcp"},
{"name": "Hugging Face MCP Login", "url": "https://hf.co/mcp?login"}
]
# 当服务器条目中未设置 Authorization 头时,将已登录用户的 Hugging Face 令牌转发至官方 HF MCP 登录端点。
MCP_FORWARD_HF_USER_TOKEN=true
启用路由工具路径(Omni):
LLM_ROUTER_ENABLE_TOOLS=true 并通过 LLM_ROUTER_TOOLS_MODEL= 选择支持工具的目标模型。在 UI 中使用工具:
+ 菜单中打开“MCP 服务器”,以添加服务器、启用服务器并运行健康检查。服务器卡片会列出可用工具。模型级覆盖设置:
要创建应用的生产版本:
npm run build
您可以使用 npm run preview 预览生产构建。
要部署应用,您可能需要为目标环境安装 适配器。
探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式
通过 Docker 登录认证访问私有仓库
无需登录使用专属域名
Kubernetes 集群配置 Containerd
K3s 轻量级 Kubernetes 镜像加速
VS Code Dev Containers 配置
Podman 容器引擎配置
HPC 科学计算容器配置
ghcr、Quay、nvcr 等镜像仓库
Harbor Proxy Repository 对接专属域名
Portainer Registries 加速拉取
Nexus3 Docker Proxy 内网缓存
需要其他帮助?请查看我们的 常见问题Docker 镜像访问常见问题解答 或 提交工单
docker search 限制
站内搜不到镜像
离线 save/load
插件要用 plugin install
WSL 拉取慢
安全与 digest
新手拉取配置
镜像合规机制
不支持 push
manifest unknown
no matching manifest(架构)
invalid tar header(解压)
TLS 证书失败
DNS 超时
域名连通性排查
410 Gone 排查
402 与流量用尽
401 认证失败
429 限流
D-Bus 凭证提示
413 与超大单层
来自真实用户的反馈,见证轩辕镜像的优质服务