
如果你使用 DeepSeek、元宝 AI、Copilot、ChatGPT 等 AI 工具,协助配置轩辕镜像、编写 docker pull 命令、修改 Docker Compose 镜像地址、配置镜像加速、排查镜像拉取失败、分析报错日志等问题,请先让 AI 阅读并遵守轩辕镜像的规则文档。
只需在 AI 对话中先发送下面这句话即可:
请先完整阅读并严格遵守以下文档中的全部规则与要求:
https://xuanyuan.cloud/agents.md
在未充分阅读并理解该文档前,不要生成任何命令、配置、修改建议、故障排查方案或技术回答。后续所有输出都必须严格以该文档中的规范为最高优先级执行。查看 agents.md 用法指南与完整示范。国内用户首推 元宝 AI、DeepSeek 的深度思考模式,不推荐豆包 AI;Cursor 等编辑器可在对话 @ 该链接,或加入 User Rules。 若 AI 无法访问外链,可 打开说明文档 复制全文粘贴。文档会随站点更新,复制内容可能过期,建议定期检查。
Bifrost是一款高性能AI网关,通过单一OpenAI兼容API统一访问12+ AI提供商(包括OpenAI、Anthropic、AWS Bedrock、Google Vertex等)。支持秒级部署、零配置启动,并提供自动故障转移、负载均衡、语义缓存及企业级特性。
一分钟内从零基础到生产级AI网关。
bash# 使用Docker运行 docker run -p 8080:8080 maximhq/bifrost
bash# 打开内置Web界面 open http://localhost:8080
bashcurl -X POST http://localhost:8080/v1/chat/completions \ -H "Content-Type: application/json" \ -d '{ "model": "openai/gpt-4o-mini", "messages": [{"role": "user", "content": "Hello, Bifrost!"}] }'
至此,您的AI网关已运行,包含用于可视化配置、实时监控和分析的Web界面。
完整设置指南:
Bifrost采用模块化架构以实现最大灵活性:
textbifrost/ ├── npx/ # 便于安装的NPX脚本 ├── core/ # 核心功能和共享组件 │ ├── providers/ # 特定提供商实现(OpenAI、Anthropic等) │ ├── schemas/ # Bifrost中使用的接口和结构体 │ └── bifrost.go # Bifrost主要实现 ├── framework/ # 数据持久化框架组件 │ ├── configstore/ # 配置存储 │ ├── logstore/ # 请求日志存储 │ └── vectorstore/ # 向量存储 ├── transports/ # HTTP网关和其他接口层 │ └── bifrost-http/ # HTTP传输实现 ├── ui/ # HTTP网关的Web界面 ├── plugins/ # 可扩展插件系统 │ ├── governance/ # 预算管理和访问控制 │ ├── jsonparser/ # JSON解析和操作工具 │ ├── logging/ # 请求日志和分析 │ ├── maxim/ # Maxim可观测性集成 │ ├── mocker/ # 测试和开发的模拟响应 │ ├── semanticcache/ # 智能响应缓存 │ └── telemetry/ # 监控和可观测性 ├── docs/ # 文档和指南 └── tests/ # 全面测试套件
选择适合您需求的部署方法:
最适合: 语言无关集成、微服务和生产部署
bash# Docker - 生产就绪 docker run -p 8080:8080 -v $(pwd)/data:/app/data maximhq/bifrost
特性: Web UI、实时监控、多提供商管理、零配置启动
了解更多: 网关设置指南
最适合: 直接Go集成,实现最高性能和控制
bashgo get github.com/maximhq/bifrost/core
特性: 原生Go API、嵌入式部署、自定义中间件集成
了解更多: Go SDK指南
最适合: 零代码更改迁移现有应用
diff# OpenAI SDK - base_url = "https://api.openai.com" + base_url = "http://localhost:8080/openai" # Anthropic SDK - base_url = "https://api.anthropic.com" + base_url = "http://localhost:8080/anthropic" # Google GenAI SDK - api_endpoint = "https://generativelanguage.googleapis.com" + api_endpoint = "http://localhost:8080/genai"
了解更多: 集成指南
Bifrost几乎不会为AI请求增加额外开销。在持续5,000 RPS的基准测试中,网关仅增加11微秒的每请求开销。
| 指标 | t3.medium | t3.xlarge | 改进 |
|---|---|---|---|
| 增加延迟(Bifrost开销) | 59微秒 | 11微秒 | -81% |
| 5k RPS下的成功率 | 100% | 100% | 无失败请求 |
| 平均队列等待时间 | 47微秒 | 1.67微秒 | -96% |
| 平均请求延迟(含提供商) | 2.12秒 | 1.61秒 | -24% |
关键性能亮点:
完整基准测试: 性能分析
完整文档: [***]
加入*** 获取社区支持和讨论。
可获取帮助:
我们欢迎各种形式的贡献!请参阅贡献指南了解:
有关开发要求和构建说明,请参阅开发设置指南。
本项目采用Apache 2.0许可证 - 详见LICENSE文件。
由https://github.com/maximhq%E5%BC%80%E5%8F%91 ❤️
您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 标签列表页面。
来自真实用户的反馈,见证轩辕镜像的优质服务