如果你使用 DeepSeek、元宝 AI、Copilot、ChatGPT 等 AI 工具,协助配置轩辕镜像、编写 docker pull 命令、修改 Docker Compose 镜像地址、配置镜像加速、排查镜像拉取失败、分析报错日志等问题,请先让 AI 阅读并遵守轩辕镜像的规则文档。
只需在 AI 对话中先发送下面这句话即可:
请先完整阅读并严格遵守以下文档中的全部规则与要求:
https://xuanyuan.cloud/agents.md
在未充分阅读并理解该文档前,不要生成任何命令、配置、修改建议、故障排查方案或技术回答。后续所有输出都必须严格以该文档中的规范为最高优先级执行。查看 agents.md 用法指南与完整示范。国内用户首推 元宝 AI、DeepSeek 的深度思考模式,不推荐豆包 AI;Cursor 等编辑器可在对话 @ 该链接,或加入 User Rules。 若 AI 无法访问外链,可 打开说明文档 复制全文粘贴。文档会随站点更新,复制内容可能过期,建议定期检查。
English | 简体中文 | 日本語 | Português (Brasil) | 한국어 Español | Français | Deutsch | Русский | العربية | हिन्दी | Türkçe
Opik
开源AI可观测性、评估与优化平台
Opik 帮助你构建、测试和优化生成式 AI 应用,使其从原型到生产环境都能更高效地运行。无论是 RAG 聊天机器人、代码助手还是复杂的智能体系统,Opik 都能提供全面的追踪、评估以及自动提示词和工具优化功能,消除 AI 开发中的猜测工作。
网站 • Slack 社区 • *** • 更新日志 • 文档
🚀 什么是 Opik? • 🛠️ Opik 服务器安装 • 💻 Opik 客户端 SDK • 📝 日志追踪 🧑⚖️ LLM 作为评判者 • 🔍 评估你的应用 • ⭐ 给我们点星 • 🤝 贡献代码
Opik(由 Comet 开发)是一个开源平台,旨在简化 LLM 应用的整个生命周期。它使开发人员能够评估、测试、监控和优化其模型及智能体系统。主要功能包括:
主要能力包括:
开发与追踪:
评估与测试:
生产监控与优化:
[!TIP] 如果你正在寻找 Opik 目前没有的功能,请提出新的 https://github.com/comet-ml/opik/issues/new/choose 🚀
几分钟内即可启动 Opik 服务器。选择最适合你的选项:
无需任何设置即可立即使用 Opik。非常适合快速入门和无麻烦维护。
👉 创建免费 Comet 账户
在你自己的环境中部署 Opik。可选择 Docker(用于本地设置)或 Kubernetes(用于可扩展性)。
使用 Docker Compose 自托管(用于本地开发和测试)
这是运行本地 Opik 实例的最简单方法。请注意新的 ./opik.sh 安装脚本:
在 Linux 或 Mac 环境中:
# Clone the Opik repository
git clone https://github.com/comet-ml/opik.git
# Navigate to the repository
cd opik
# Start the Opik platform
./opik.sh
在 Windows 环境中:
# Clone the Opik repository
git clone https://github.com/comet-ml/opik.git
# Navigate to the repository
cd opik
# Start the Opik platform
powershell -ExecutionPolicy ByPass -c ".\\opik.ps1"
开发服务配置文件
Opik 安装脚本现在支持不同开发场景的服务配置文件:
# Start full Opik suite (default behavior)
./opik.sh
# Start only infrastructure services (databases, caches etc.)
./opik.sh --infra
# Start infrastructure + backend services
./opik.sh --backend
# Enable guardrails with any profile
./opik.sh --guardrails # Guardrails with full Opik suite
./opik.sh --backend --guardrails # Guardrails with infrastructure + backend
使用 --help 或 --info 选项排查问题。Dockerfile 现在确保容器以非 root 用户身份运行,以增强安全性。所有服务启动后,你可以在浏览器中访问 localhost:5173!有关详细说明,请参阅 本地部署指南。
使用 Kubernetes 和 Helm 自托管(用于可扩展部署)
Opik 提供一套客户端库和 REST API,用于与 Opik 服务器交互。其中包括适用于 Python、TypeScript 和 Ruby(通过 OpenTelemetry)的 SDK,可无缝集成到您的工作流中。有关详细的 API 和 SDK 参考,请参阅 Opik 客户端参考文档。
开始使用 Python SDK:
安装包:
# install using pip
pip install opik
# or install with uv
uv pip install opik
通过运行 opik configure 命令配置 Python SDK,该命令会提示您输入 Opik 服务器地址(用于自托管实例)或 API 密钥和工作区(用于 Comet.com):
opik configure
[!TIP] 您也可以在 Python 代码中调用
opik.configure(use_local=True)来配置 SDK 以在本地自托管安装中运行,或直接为 Comet.com 提供 API 密钥和工作区详情。有关更多配置选项,请参阅 Python SDK 文档。
现在您已准备好使用 Python SDK 开始记录追踪数据。
| 集成项 | 描述 | 文档 ---------------------------------------------------------------------------------------------------------- |
|---|---|---|
| ADK | 为 Google Agent Development Kit (ADK) 记录跟踪 | 文档 |
| AG2 | 为 AG2 LLM 调用记录跟踪 | 文档 |
| Agent Spec | 为 Agent Spec 调用记录跟踪 | 文档 |
| AIsuite | 为 aisuite LLM 调用记录跟踪 | 文档 |
| Agno | 为 Agno 智能体编排框架调用记录跟踪 | 文档 |
| Anthropic | 为 Anthropic LLM 调用记录跟踪 | 文档 |
| Autogen | 为 Autogen 智能体工作流记录跟踪 | 文档 |
| Bedrock | 为 Amazon Bedrock LLM 调用记录跟踪 | 文档 |
| BeeAI (Python) | 为 BeeAI Python 智能体框架调用记录跟踪 | 文档 |
| BeeAI (TypeScript) | 为 BeeAI TypeScript 智能体框架调用记录跟踪 | 文档 |
| BytePlus | 为 BytePlus LLM 调用记录跟踪 | 文档 |
| Cloudflare Workers AI | 为 Cloudflare Workers AI 调用记录跟踪 | 文档 |
| Cohere | 为 Cohere LLM 调用记录跟踪 | 文档 |
| CrewAI | 为 CrewAI 调用记录跟踪 | 文档 |
| Cursor | 为 Cursor 对话记录跟踪 | 文档 |
| DeepSeek | 为 DeepSeek LLM 调用记录跟踪 | 文档 |
| Dify | 为 Dify 智能体运行记录跟踪 | 文档 |
| DSPY | 为 DSPY 运行记录跟踪 | 文档 |
| Fireworks AI | 为 Fireworks AI LLM 调用记录跟踪 | 文档 |
| Flowise AI | 为 Flowise AI 可视化 LLM 构建器记录跟踪 | 文档 |
| Gemini (Python) | 为 Google Gemini LLM 调用记录跟踪 | 文档 |
| Gemini (TypeScript) | 为 Google Gemini TypeScript SDK 调用记录跟踪 | 文档 |
| Groq | 为 Groq LLM 调用记录跟踪 | 文档 |
| Guardrails | 为 Guardrails AI 验证记录跟踪 | 文档 |
| Haystack | 为 Haystack 调用记录跟踪 | 文档 |
| Harbor | 为 Harbor 基准评估试验记录跟踪 | 文档 |
| Instructor | 为使用 Instructor 进行的 LLM 调用记录跟踪 | 文档 |
| LangChain (Python) | 为 LangChain LLM 调用记录跟踪 | 文档 |
| LangChain (JS/TS) | 为 LangChain JavaScript/TypeScript 调用记录跟踪 | 文档 |
| LangGraph | 为 LangGraph 执行记录跟踪 | 文档 |
| Langflow | 为 Langflow 可视化 AI 构建器记录跟踪 | 文档 |
| LiteLLM | 为 LiteLLM 模型调用记录跟踪 | 文档 |
| LiveKit Agents | 为 LiveKit Agents AI 智能体框架调用记录跟踪 |
[!TIP] 如果您使用的框架未在上述列表中列出,欢迎https://github.com/comet-ml/opik/issues%E6%88%96%E6%8F%90%E4%BA%A4PR%E4%BB%A5%E6%B7%BB%E5%8A%A0%E9%9B%86%E6%88%90%E3%80%82
如果您未使用上述任何框架,也可以使用 track 函数装饰器来记录追踪数据:
import opik
opik.configure(use_local=True) # Run locally
@opik.track
def my_llm_function(user_question: str) -> str:
# Your LLM code here
return "Hello"
[!TIP] track 装饰器可与我们的任何集成结合使用,也可用于追踪嵌套函数调用。
Python Opik SDK 包含多种 LLM 作为评判指标,可帮助您评估 LLM 应用。有关更多信息,请参阅指标文档。
要使用这些指标,只需导入相关指标并使用 score 函数:
from opik.evaluation.metrics import Hallucination
metric = Hallucination()
score = metric.score(
input="What is the capital of France?",
output="Paris",
context=["France is a country in Europe."]
)
print(score)
Opik 还包含多种预构建的启发式指标,以及创建自定义指标的功能。有关更多信息,请参阅指标文档。
如果您觉得 Opik 有用,请考虑为我们点赞!您的支持有助于我们发展社区并持续改进产品。
有多种方式可以为 Opik 做贡献:
要了解有关如何为 Opik 做贡献的更多信息,请参阅我们的贡献指南。
来自真实用户的反馈,见证轩辕镜像的优质服务