ghcr.io/decolua/9router:0.5.6
让 AI 帮你使用轩辕镜像? · 展开查看说明 · 点击收起说明
如果你使用 DeepSeek、元宝 AI、Copilot、ChatGPT 等 AI 工具,协助配置轩辕镜像、编写 docker pull 命令、修改 Docker Compose 镜像地址、配置镜像加速、排查镜像拉取失败、分析报错日志等问题,请先让 AI 阅读并遵守轩辕镜像的规则文档。
只需在 AI 对话中先发送下面这句话即可:
请先完整阅读并严格遵守以下文档中的全部规则与要求:
https://xuanyuan.cloud/agents.md
在未充分阅读并理解该文档前,不要生成任何命令、配置、修改建议、故障排查方案或技术回答。后续所有输出都必须严格以该文档中的规范为最高优先级执行。查看 agents.md 用法指南与完整示范。国内用户首推 元宝 AI、DeepSeek 的深度思考模式,不推荐豆包 AI;Cursor 等编辑器可在对话 @ 该链接,或加入 User Rules。 若 AI 无法访问外链,可 打开说明文档 复制全文粘贴。文档会随站点更新,复制内容可能过期,建议定期检查。
9Router - 免费 AI 路由与 Token 节省工具
永不停止编码。通过 RTK 节省 20-40% 的 tokens,并自动回退至免费及低成本 AI 模型。
连接所有 AI 代码工具(Claude Code、Cursor、Antigravity、Copilot、Codex、*、OpenCode、Cline、OpenClaw...)至 40+ AI 提供商及 100+ 模型。**
🚀 快速开始 • 💡 核心功能 • 📖 安装指南 • 🌐 官网
🇻🇳 Tiếng Việt • 🇨🇳 中文 • 🇯🇵 日本語 • 🇷🇺 Русский
- 过滤器:
git-diff、git-status、grep、find、ls、tree、dedup-log、smart-truncate、read-numbered、search-list - 自动检测: 无需配置——RTK会查看每个
tool_result的前1KB内容并选择合适的过滤器。 - 设计安全: 如果过滤器失败、抛出异常或导致输出变大,RTK会静默保留原始文本。错误绝不会中断您的请求。
- 通用性: 适用于所有格式(OpenAI、Claude、*、Cursor、Kiro、OpenAI Responses),因为它在任何格式转换之前**运行。
- 默认开启: 可随时在控制台 → 端点设置中切换。
Without RTK: 47K tokens sent to LLM
With RTK: 28K tokens sent to LLM (40% saved · same context · same answer)
🧠 Headroom 令牌节省器
Headroom 是可选组件,独立运行。9Router 会调用 Headroom 的本地 /v1/compress 端点,然后保持正常的路由、回退、身份验证和使用跟踪:
Client → 9Router → Headroom /v1/compress → 9Router → provider
本地设置:
pip install "headroom-ai[proxy]"
headroom proxy --port 8787
在控制台 → 端点 → 令牌节省器 → Headroom 中启用。默认 URL:http://localhost:8787。
Docker 示例:
# Headroom 服务在同一 Docker 网络中
# Headroom 在主机上运行
如果 Headroom 宕机或返回错误,9Router 会故障开放并发送原始请求。
🐴 Ponytail(懒惰资深开发者)
Ponytail 会在每个请求中注入一个“懒惰资深开发者”系统提示,使 LLM 倾向于编写最小化、YAGNI 优先的代码——删除优先于添加,标准库优先于新依赖,单行代码优先于抽象。改编自 https://github.com/DietrichGebert/ponytail%E3%80%82
- 精简版 — 构建所需功能,并指出更懒惰的替代方案。
- 完整版 — 强制 YAGNI 阶梯:标准库 → 原生功能 → 现有依赖 → 单行代码 → 最小化代码。
- 极致版 — YAGNI 极端主义:删除优先,交付单行代码,并在同一响应中质疑其余需求。
Without Ponytail: verbose code, extra abstractions, "just in case" scaffolding
With Ponytail: shortest working diff, no unrequested abstractions, fewer tokens
绝不会牺牲:输入验证、防止数据丢失的错误处理、安全性、可访问性或任何明确要求的内容。在控制台 → 端点 → Ponytail 中启用。可与 Caveman(输出简洁性)和 RTK(输入压缩)叠加使用。
🎯 智能三层回退
创建具有自动回退功能的组合:
Combo: "my-coding-stack"
1. cc/claude-opus-4-6 (your subscription)
2. glm/glm-4.7 (cheap backup, $0.6/1M)
3. if/kimi-k2-thinking (free fallback)
→ Auto switches when quota runs out or errors occur
📊 实时配额跟踪
- 每个提供商的令牌消耗
- 重置倒计时(5小时、每日、每周)
- 付费层级的成本估算
- 月度支出报告
🔄 格式转换
格式间的无缝转换:
- OpenAI ↔ Claude ↔ ******* ↔ Cursor ↔ Kiro ↔ Vertex ↔ Antigravity ↔ Ollama ↔ OpenAI Responses
- 您的 CLI 工具发送 OpenAI 格式 → 9Router 进行转换 → 提供商接收原生格式
- 适用于任何支持自定义 OpenAI 端点的工具
👥 多账户支持
- 为每个提供商添加多个账户
- 自动轮询或基于优先级的路由
- 当一个账户达到配额时回退到下一个账户
🔄 令牌自动刷新
- OAuth 令牌在过期前自动刷新
- 无需手动重新认证
- 所有提供商间的无缝体验
🎨 自定义组合
- 创建无限的模型组合
- 混合订阅、廉价和免费层级
- 为组合命名以便快速访问
- 通过云同步在设备间共享组合
📝 请求日志
- 启用调试模式以获取完整的请求/响应日志
- 跟踪 API 调用、标头和负载
- 排查集成问题
- 导出日志用于分析
💾 云同步
- 在设备间同步提供商、组合和设置
- 自动后台同步
- 安全加密存储
- 从任何地方访问您的设置
云运行时注意事项
- 生产环境中首选服务器端云变量:
BASE_URL(同步调度器使用的内部回调 URL)CLOUD_URL(云同步端点基础 URL)- 为了兼容性/UI,仍支持
NEXT_PUBLIC_BASE_URL和NEXT_PUBLIC_CLOUD_URL,但服务器运行时现在优先使用BASE_URL/CLOUD_URL。 - 云同步请求现在使用超时 + 快速失败机制,以避免在云 DNS/网络不可用时 UI 挂起。
📊 使用分析
- 跟踪每个提供商和模型的令牌使用情况
- 成本估算和支出趋势
- 月度报告和洞察
- 优化您的 AI 支出
[!IMPORTANT] 💡 重要提示 - 理解控制台成本:
使用分析中显示的“成本”仅用于跟踪和比较目的。 9Router 本身从不向您收费。您只需直接向提供商付费(如果使用付费服务)。
示例: 如果您在使用 iFlow 模型时,控制台显示“总成本 $290”,这表示您直接使用付费 API 本应支付的金额。您的实际成本 = $0(iFlow 是免费无限量的)。
可以将其视为“节省跟踪器”,显示您通过使用免费模型或通过 9Router 路由所节省的金额!
🌐 随处部署
- 💻 本地主机 - 默认方式,支持离线使用
- ☁️ VPS/云服务器 - 跨设备共享
- 🐳 Docker - 一键部署
- 🚀 Cloudflare Workers - 全球边缘网络
💰 价格概览
| 层级 | 提供商 | 成本 | 配额重置 | 最适合 |
|---|---|---|---|---|
| 🚀 令牌节省器 | RTK(内置) | 免费 | 始终开启 | 每次请求节省 20-40% 令牌 |
| 💳 订阅 | Claude Code (Pro/Max) | $20-200/月 | 5小时 + 每周 | 已订阅用户 |
| Codex (Plus/Pro) | $20-200/月 | 5小时 + 每周 | OpenAI 用户 | |
| GitHub Copilot | $10-19/月 | 每月 | GitHub 用户 | |
| Cursor IDE | $20/月 | 每月 | Cursor 用户 | |
| 💰 经济实惠 | GLM-5.1 / GLM-4.7 | $0.6/百万令牌 | 每日 10点 | 预算有限的备份方案 |
| MiniMax M2.7 | $0.2/百万令牌 | 5小时滚动 | 最经济的选择 | |
| Kimi K2.5 | 固定 $9/月 | 每月 1000万令牌 | 可预测成本 | |
| 🆓 免费 | Kiro AI | $0 | 无限量 | Claude 4.5 + GLM-5 + MiniMax 免费版 |
| OpenCode Free | $0 | 无限量 | 无需认证,自动获取模型 | |
| Vertex AI | $300 credits | 新 GCP 账户 | *** 3 Pro + DeepSeek + GLM-5 |
💡 专业提示: RTK + Kiro AI + OpenCode Free 组合 = $0 成本 + 20-40% 令牌节省!
📊 理解 9Router 成本与计费
9Router 计费实际情况:
✅ 9Router 软件 = 永久免费(开源,永不收费) ✅ 控制台“成本” = 仅显示/跟踪(非实际账单) ✅ 您直接向提供商付费(订阅或 API 费用) ✅ 免费提供商保持免费(iFlow、Kiro、Qwen = $0 无限量) ❌ 9Router 从不发送发票或收取您的卡费
成本显示原理:
❓ 常见问题
📊 为什么仪表盘显示高额费用?
仪表盘会跟踪您的令牌使用情况,并显示预估费用,模拟直接使用付费API的场景。这并非实际账单——而是用于展示通过9Router使用免费模型或现有订阅所节省的金额。
示例:
- 仪表盘显示: "$290 total cost"
- 实际情况: 您正在使用iFlow(FREE unlimited)
- 您的实际费用: $0.00
- $290的含义: 通过使用免费模型而非付费API,您节省的金额!
费用显示是一个“节省跟踪器”,帮助您了解使用模式和优化机会。
💳 9Router会向我收费吗?
不会。 9Router是免费的开源软件,运行在您自己的计算机上。它绝不会向您收取任何费用。
您只需支付:
- ✅ 订阅提供商(Claude Code $20/mo,Codex $20-200/mo)→ 直接在其网站上支付
- ✅ 低成本提供商(GLM、MiniMax)→ 直接支付给他们,9Router仅负责路由请求
- ❌ 9Router本身 → 绝不会收取任何费用
9Router是本地代理/路由器。它不存储您的***信息,无法发送账单,也没有计费系统。它是完全免费的软件。
🆓 免费提供商真的是无限量的吗?
是的! 当前的免费提供商(Kiro、OpenCode Free、Vertex)是真正免费的,没有隐藏费用。
这些是各公司提供的免费服务:
- Kiro AI:通过AWS Builder ID / Google / GitHub OAuth提供免费无限量的Claude 4.5 + GLM-5 + MiniMax
- OpenCode Free:无需认证的直通代理,模型自动从
opencode.ai/zen/v1/models获取 - Vertex AI:新Google Cloud账户可获得$300免费额度(90天)
9Router仅将您的请求路由到这些服务——没有“陷阱”或未来计费。它们是真正的免费服务,9Router通过fallback支持使它们易于使用。
已停用的免费套餐(不再推荐):
- ❌ iFlow:曾为免费无限量,现已改为付费(2026年)
- ❌ Qwen Code:阿里巴巴于2026-04-15停用免费OAuth套餐
- ❌ ***** CLI**:仍可使用,但将其与非CLI工具(Claude、Codex、Cursor...)配合使用可能导致账户被封禁——仅在坚持使用*** CLI本身时使用
💰 如何最小化实际AI成本?
优先免费策略:
- 从100%免费组合开始:
1. gc/gemini-3-flash (180K/month free from Google)
2. if/kimi-k2-thinking (unlimited free from iFlow)
3. qw/qwen3-coder-plus (unlimited free from Qwen)
成本:$0/month
- 仅在需要时添加低成本备份:
4. glm/glm-4.7 ($0.6/1M tokens)
额外成本:仅为实际使用量付费
- 最后使用订阅提供商:
- 仅在您已订阅的情况下使用
- 9Router通过配额跟踪帮助最大化其价值
结果: 大多数用户仅使用免费套餐即可实现$0/month的成本!
📈 如果我的使用量突然激增怎么办?
9Router的智能fallback可防止意外费用:
场景: 您正在进行编码冲刺,用完了配额
没有9Router:
- ❌ 达到速率限制 → 工作停止 → 挫败感
- ❌ 或者:意外产生巨额API账单
有了9Router:
- ✅ 订阅达到限制 → 自动fallback到低成本层级
- ✅ 低成本层级费用上升 → 自动fallback到免费层级
- ✅ 永不停止编码 → 可预测的成本
您掌控一切: 在仪表盘中为每个提供商设置支出限制,9Router会严格遵守。
VPS 部署
# 克隆并安装
git clone https://github.com/decolua/9router.git
cd 9router
npm install
npm run build
# 配置
export JWT_SECRET="your-secure-secret-change-this"
export INITIAL_PASSWORD="your-password"
export DATA_DIR="/var/lib/9router"
export PORT="20128"
export HOSTNAME="0.0.0.0"
export NODE_ENV="production"
export NEXT_PUBLIC_BASE_URL="http://localhost:20128"
export NEXT_PUBLIC_CLOUD_URL="https://9router.com"
export API_KEY_SECRET="endpoint-proxy-api-key-secret"
export MACHINE_ID_SALT="endpoint-proxy-salt"
# 启动
npm run start
# 或使用 PM2
npm install -g pm2
pm2 start npm --name 9router -- start
pm2 save
pm2 startup
Docker
已发布镜像(多平台 linux/amd64 + linux/arm64):
- Docker Hub: https://hub.docker.com/r/decolua/9router
- GHCR: https://github.com/decolua/9router/pkgs/container/9router
快速启动(使用已发布镜像):
docker run -d \
--name 9router \
-p 20128:20128 \
-v "$HOME/.9router:/app/data" \
-e DATA_DIR=/app/data \
decolua/9router:latest
→ 打开 http://localhost:20128
从源码构建(开发环境):
git clone https://github.com/decolua/9router.git
cd 9router/app
docker build -t 9router .
docker run -d --name 9router -p 20128:20128 \
-v "$HOME/.9router:/app/data" -e DATA_DIR=/app/data 9router
容器默认值:
PORT=20128HOSTNAME=0.0.0.0
常用命令:
docker logs -f 9router
docker restart 9router
docker stop 9router && docker rm 9router
docker pull decolua/9router:latest # 更新至最新版本
数据持久化: 主机上的 $HOME/.9router/db/data.sqlite ↔ 容器内的 /app/data/db/data.sqlite。
环境变量
| 变量 | 默认值 | 描述 |
|---|---|---|
JWT_SECRET | 自动生成(~/.9router/jwt-secret) | 用于仪表板身份验证Cookie的JWT签名密钥(覆盖此值可在多实例间共享) |
INITIAL_PASSWORD | 123456 | 无保存哈希时的首次登录密码 |
DATA_DIR | ~/.9router | 应用主数据位置(SQLite数据库位于$DATA_DIR/db/data.sqlite) |
PORT | 框架默认值 | 服务端口(示例中为20128) |
HOSTNAME | 框架默认值 | 绑定主机(Docker默认值为0.0.0.0) |
NODE_ENV | 运行时默认值 | 设置为production用于部署环境 |
BASE_URL | http://localhost:20128 | 云同步任务使用的服务器端内部基础URL |
CLOUD_URL | https://9router.com | 服务器端云同步端点基础URL |
NEXT_PUBLIC_BASE_URL | http://localhost:3000 | 向后兼容/公共基础URL(服务器运行时优先使用BASE_URL) |
NEXT_PUBLIC_CLOUD_URL | https://9router.com | 向后兼容/公共云URL(服务器运行时优先使用CLOUD_URL) |
API_KEY_SECRET | endpoint-proxy-api-key-secret | 用于生成API密钥的HMAC密钥 |
MACHINE_ID_SALT | endpoint-proxy-salt | 用于稳定机器ID哈希的盐值 |
ENABLE_REQUEST_LOGS | false | 启用logs/目录下的请求/响应日志 |
AUTH_COOKIE_SECURE | false | 强制使用Secure身份验证Cookie(在HTTPS反向代理后设置为true) |
REQUIRE_API_KEY | false | 在/v1/*路由上强制使用Bearer API密钥(互联网暴露部署推荐启用) |
HTTP_PROXY、HTTPS_PROXY、ALL_PROXY、NO_PROXY | 空 | 上游服务调用的可选出站代理 |
[!NOTE]
- 也支持小写代理变量:
http_proxy、https_proxy、all_proxy、no_proxy。.env文件不会打包到Docker镜像中(通过.dockerignore排除);使用--env-file或-e注入运行时配置。- 在Windows系统上,
APPDATA可用于本地存储路径解析。INSTANCE_NAME出现在旧文档/环境模板中,但当前运行时未使用。
运行时文件和存储
- 应用主状态:
${DATA_DIR}/db/data.sqlite(SQLite数据库 — 包含服务提供商、组合配置、别名、密钥、设置、使用历史) - 自动备份:
${DATA_DIR}/db/backups/ - 可选请求/翻译器日志:当
ENABLE_REQUEST_LOGS=true时,日志存储在/logs/... - 在Docker容器中,
${DATA_DIR}和~/.9router指向同一位置 — 构建时会创建符号链接/root/.9router -> /app/data
📊 可用模型
查看所有可用模型
Claude Code(cc/) - Pro/Max:
cc/claude-opus-4-7cc/claude-opus-4-6cc/claude-sonnet-4-6cc/claude-sonnet-4-5-20250929cc/claude-haiku-4-5-20251001
Codex(cx/) - Plus/Pro:
cx/gpt-5.5cx/gpt-5.4cx/gpt-5.3-codexcx/gpt-5.2-codexcx/gpt-5.1-codex-max
GitHub Copilot(gh/):
gh/gpt-5.4gh/claude-opus-4.7gh/claude-sonnet-4.6gh/gemini-3.1-pro-previewgh/grok-code-fast-1
Cursor(cu/) - 订阅制:
cu/claude-4.6-opus-maxcu/claude-4.5-sonnet-thinkingcu/gpt-5.3-codexcu/kimi-k2.5
GLM(glm/) - 0.6***/百万 tokens:
glm/glm-5.1glm/glm-5glm/glm-4.7
MiniMax(minimax/) - 0.2***/百万 tokens:
minimax/MiniMax-M2.7minimax/MiniMax-M2.5
Kimi(kimi/) - 9***/月 flat 费率:
kimi/kimi-k2.5kimi/kimi-k2.5-thinking
Kiro(kr/) - 免费无限量:
kr/claude-sonnet-4.5kr/claude-haiku-4.5kr/glm-5kr/MiniMax-M2.5kr/qwen3-coder-nextkr/deepseek-3.2
OpenCode Free(oc/) - 免费无需认证:
- 从
opencode.ai/zen/v1/models自动获取
Vertex AI(vertex/) - 300***免费额度:
vertex/gemini-3.1-pro-previewvertex/gemini-3-flash-previewvertex/gemini-2.5-flashvertex-partner/glm-5-maasvertex-partner/deepseek-v3.2-maas
🐛 故障排除
"语言模型未提供消息"
- 服务提供商配额耗尽 → 检查仪表板配额跟踪器
- 解决方案:使用组合回退或切换到更低成本的层级
速率限制
- 订阅配额用尽 → 回退到GLM/MiniMax
- 添加组合:
cc/claude-opus-4-7 → glm/glm-5.1 → kr/claude-sonnet-4.5
OAuth令牌过期
- 9Router会自动刷新令牌
- 若问题持续:仪表板 → 服务提供商 → 重新连接
成本过高
- 在仪表板中启用RTK → 端点设置(默认开启,节省20-40% tokens)
- 检查仪表板中的使用统计
- 将主模型切换为GLM/MiniMax
- 非关键任务使用免费层级(Kiro、OpenCode Free、Vertex)
仪表板在错误端口打开
- 设置
PORT=20128和NEXT_PUBLIC_BASE_URL=http://localhost:20128
首次登录失败
- 检查
.env中的INITIAL_PASSWORD - 若未设置,回退密码为
123456
logs/目录下无请求日志
- 设置
ENABLE_REQUEST_LOGS=true
🛠️ 技术栈
- 运行时:Node.js 20+
- 框架:Next.js 16
- UI:React 19 + Tailwind CSS 4
- 数据库:SQLite(better-sqlite3 / node:sqlite / sql.js 回退)
- 流式传输:服务器发送事件(SSE)
- 认证:OAuth 2.0(PKCE)+ JWT + API密钥
📝 API参考
聊天补全
POST http://localhost:20128/v1/chat/completions
Authorization: Bearer your-api-key
Content-Type: application/json
{
"model": "cc/claude-opus-4-6",
"messages": [
{"role": "user", "content": "Write a function to..."}
],
"stream": true
}
列出模型
GET http://localhost:20128/v1/models
Authorization: Bearer your-api-key
→ 以OpenAI格式返回所有模型和组合
📧 支持
- 网站:9router.com
- GitHub:https://github.com/decolua/9router
- 问题反馈:https://github.com/decolua/9router/issues
👥 贡献者
感谢所有帮助改进9Router的贡献者!
📊 Star Chart
🔀 Forks
https://github.com/diegosouzapw/OmniRoute — 9Router的全功能TypeScript分支。添加了36+服务提供商、4层自动回退、多模态API(图像、嵌入、音频、TTS)、熔断器、语义缓存、LLM评估和精致的仪表板。包含368+单元测试。可通过npm和Docker获取。
🙏 致谢
站在巨人的肩膀上构建:
- https://github.com/router-for-me/CLIProxyAPI — 启发此JavaScript移植版的原始Go实现。
特别感谢这些作者 — 没有他们的工作,9Router的令牌节省功能就无法实现。在GitHub上给他们点个⭐吧!
📄 许可证
MIT许可证 - 详见LICENSE。
用❤️为24/7编码的开发者打造
镜像拉取常见问题
功能
错误码
用户好评
来自真实用户的反馈,见证轩辕镜像的优质服务