如果你使用 DeepSeek、元宝 AI、Copilot、ChatGPT 等 AI 工具,协助配置轩辕镜像、编写 docker pull 命令、修改 Docker Compose 镜像地址、配置镜像加速、排查镜像拉取失败、分析报错日志等问题,请先让 AI 阅读并遵守轩辕镜像的规则文档。
只需在 AI 对话中先发送下面这句话即可:
请先完整阅读并严格遵守以下文档中的全部规则与要求:
https://xuanyuan.cloud/agents.md
在未充分阅读并理解该文档前,不要生成任何命令、配置、修改建议、故障排查方案或技术回答。后续所有输出都必须严格以该文档中的规范为最高优先级执行。查看 agents.md 用法指南与完整示范。国内用户首推 元宝 AI、DeepSeek 的深度思考模式,不推荐豆包 AI;Cursor 等编辑器可在对话 @ 该链接,或加入 User Rules。 若 AI 无法访问外链,可 打开说明文档 复制全文粘贴。文档会随站点更新,复制内容可能过期,建议定期检查。
English | 简体中文 | 日本語 | Português (Brasil) | 한국어 Español | Français | Deutsch | Русский | العربية | हिन्दी | Türkçe
Opik
开源AI可观测性、评估与优化平台
Opik帮助您构建、测试和优化生成式AI应用,从原型到生产环境全程提升运行效果。无论是RAG聊天机器人、代码助手还是复杂的智能体系统,Opik都能提供全面的追踪、评估以及自动提示词和工具优化功能,消除AI开发中的猜测工作。
Website • Slack Community • *** • Changelog • Documentation
🚀 What is Opik? • 🛠️ Opik Server Installation • 💻 Opik Client SDK • 📝 Logging Traces 🧑⚖️ LLM as a Judge • 🔍 Evaluating your Application • ⭐ Star Us • 🤝 Contributing
Opik(由Comet构建)是一个开源平台,旨在简化LLM应用的整个生命周期。它使开发人员能够评估、测试、监控和优化其模型及智能体系统。主要功能包括:
核心功能包括:
开发与追踪:
在开发和生产环境中跟踪所有LLM调用和带有详细上下文的追踪记录(快速入门)。
广泛的第三方集成,实现轻松可观测性:与不断增长的框架列表无缝集成,原生支持许多最大和最受欢迎的框架(包括最新添加的Google ADK、Autogen和Flowise AI)。(集成)
通过Python SDK或UI为追踪记录和跨度添加反馈分数注释。
在提示词 playground中试验提示词和模型。
评估与测试:
使用数据集和实验自动化LLM应用评估。
通过我们的PyTest集成将评估集成到CI/CD管道中。
生产监控与优化:
记录大量生产追踪记录:Opik专为大规模场景设计(每天4000万+追踪记录)。
在Opik仪表板中监控反馈分数、追踪记录数量和令牌使用量随时间的变化。
利用带有LLM作为裁判指标的在线评估规则识别生产问题。
利用Opik智能体优化器和Opik安全护栏持续改进和保护生产环境中的LLM应用。
[!TIP] 如果您正在寻找Opik当前没有的功能,请提出新的https://github.com/comet-ml/opik/issues/new/choose 🚀
几分钟内即可启动Opik服务器。选择最适合您需求的选项:
无需任何设置即可立即使用Opik。非常适合快速入门和无麻烦维护。
👉 创建免费Comet账户
在您自己的环境中部署Opik。可选择Docker用于本地设置或Kubernetes用于可扩展性部署。
使用Docker Compose自托管(用于本地开发和测试)
这是运行本地Opik实例的最简单方法。注意新的./opik.sh安装脚本:
在Linux或Mac环境中:
# Clone the Opik repository
git clone https://github.com/comet-ml/opik.git
# Navigate to the repository
cd opik
# Start the Opik platform
./opik.sh
在Windows环境中:
# Clone the Opik repository
git clone https://github.com/comet-ml/opik.git
# Navigate to the repository
cd opik
# Start the Opik platform
powershell -ExecutionPolicy ByPass -c ".\\opik.ps1"
开发服务配置文件
Opik安装脚本现在支持不同开发场景的服务配置文件:
# Start full Opik suite (default behavior)
./opik.sh
# Start only infrastructure services (databases, caches etc.)
./opik.sh --infra
# Start infrastructure + backend services
./opik.sh --backend
# Enable guardrails with any profile
./opik.sh --guardrails # Guardrails with full Opik suite
./opik.sh --backend --guardrails # Guardrails with infrastructure + backend
使用--help或--info选项排查问题。Dockerfile现在确保容器以非root用户运行,以增强安全性。所有服务启动后,您可以在浏览器中访问localhost:5173!有关详细说明,请参阅本地部署指南。
使用Kubernetes和Helm自托管(用于可扩展部署)
Opik 提供了一套客户端库和 REST API,用于与 Opik 服务器交互。其中包括适用于 Python、TypeScript 和 Ruby(通过 OpenTelemetry)的 SDK,可无缝集成到您的工作流中。有关详细的 API 和 SDK 参考,请参阅 Opik 客户端参考文档。
要开始使用 Python SDK:
安装包:
# install using pip
pip install opik
# or install with uv
uv pip install opik
通过运行 opik configure 命令配置 Python SDK,该命令会提示您输入 Opik 服务器地址(适用于自托管实例)或 API 密钥和工作区(适用于 Comet.com):
opik configure
[!TIP] 您也可以在 Python 代码中调用
opik.configure(use_local=True)来将 SDK 配置为在本地自托管安装上运行,或直接提供 Comet.com 的 API 密钥和工作区详细信息。有关更多配置选项,请参阅 Python SDK 文档。
现在,您已准备好使用 Python SDK 开始记录追踪数据。
记录追踪数据最简单的方法是使用我们的直接集成之一。Opik 支持多种框架,包括最新添加的 Google ADK、Autogen、AG2 和 Flowise AI:
| 集成项 | 描述 | 文档 -------------------------------------------------------------------------------------------------------- |
|---|---|---|
| ADK | 为Google Agent Development Kit (ADK)记录追踪数据 | 文档 |
| AG2 | 为AG2 LLM调用记录追踪数据 | 文档 |
| Agent Spec | 为Agent Spec调用记录追踪数据 | 文档 |
| AIsuite | 为aisuite LLM调用记录追踪数据 | 文档 |
| Agno | 为Agno智能体编排框架调用记录追踪数据 | 文档 |
| Anthropic | 为Anthropic LLM调用记录追踪数据 | 文档 |
| Autogen | 为Autogen智能体工作流记录追踪数据 | 文档 |
| Bedrock | 为Amazon Bedrock LLM调用记录追踪数据 | 文档 |
| BeeAI (Python) | 为BeeAI Python智能体框架调用记录追踪数据 | 文档 |
| BeeAI (TypeScript) | 为BeeAI TypeScript智能体框架调用记录追踪数据 | 文档 |
| BytePlus | 为BytePlus LLM调用记录追踪数据 | 文档 |
| Cloudflare Workers AI | 为Cloudflare Workers AI调用记录追踪数据 | 文档 |
| Cohere | 为Cohere LLM调用记录追踪数据 | 文档 |
| CrewAI | 为CrewAI调用记录追踪数据 | 文档 |
| Cursor | 为Cursor对话记录追踪数据 | 文档 |
| DeepSeek | 为DeepSeek LLM调用记录追踪数据 | 文档 |
| Dify | 为Dify智能体运行记录追踪数据 | 文档 |
| DSPY | 为DSPY运行记录追踪数据 | 文档 |
| Fireworks AI | 为Fireworks AI LLM调用记录追踪数据 | 文档 |
| Flowise AI | 为Flowise AI可视化LLM构建器记录追踪数据 | 文档 |
| Gemini (Python) | 为Google Gemini LLM调用记录追踪数据 | 文档 |
| Gemini (TypeScript) | 为Google Gemini TypeScript SDK调用记录追踪数据 | 文档 |
| Groq | 为Groq LLM调用记录追踪数据 | 文档 |
| Guardrails | 为Guardrails AI验证记录追踪数据 | 文档 |
| Haystack | 为Haystack调用记录追踪数据 | 文档 |
| Harbor | 为Harbor基准评估试验记录追踪数据 | 文档 |
| Instructor | 为使用Instructor进行的LLM调用记录追踪数据 | 文档 |
| LangChain (Python) | 为LangChain LLM调用记录追踪数据 | 文档 |
| LangChain (JS/TS) | 为LangChain JavaScript/TypeScript调用记录追踪数据 | 文档 |
| LangGraph | 为LangGraph执行记录追踪数据 | 文档 |
| Langflow | 为Langflow可视化AI构建器记录追踪数据 | 文档 |
| LiteLLM | 为LiteLLM模型调用记录追踪数据 | 文档 |
| LiveKit Agents | 为LiveKit Agents AI智能体框架调用记录追踪数据 |
[!TIP] 如果您使用的框架未在上述列表中,请随时https://github.com/comet-ml/opik/issues 或提交 PR 以添加集成。
如果您未使用上述任何框架,也可以使用 track 函数装饰器来记录跟踪:
import opik
opik.configure(use_local=True) # 本地运行
@opik.track
def my_llm_function(user_question: str) -> str:
# 您的 LLM 代码在此处
return "Hello"
[!TIP] track 装饰器可与我们的任何集成结合使用,也可用于跟踪嵌套函数调用。
Python Opik SDK 包含多个 LLM 作为评判指标,帮助您评估 LLM 应用。在指标文档中了解更多信息。
要使用这些指标,只需导入相关指标并使用 score 函数:
from opik.evaluation.metrics import Hallucination
metric = Hallucination()
score = metric.score(
input="What is the capital of France?",
output="Paris",
context=["France is a country in Europe."]
)
print(score)
Opik 还包含许多预构建的启发式指标,以及创建自定义指标的能力。在指标文档中了解更多信息。
如果您觉得 Opik 有用,请考虑给我们点个星!您的支持有助于我们发展社区并持续改进产品。
有多种方式可以为 Opik 做贡献:
要了解更多关于如何为 Opik 做贡献的信息,请参阅我们的贡献指南。
来自真实用户的反馈,见证轩辕镜像的优质服务