
如果你使用 DeepSeek、元宝 AI、Copilot、ChatGPT 等 AI 工具,协助配置轩辕镜像、编写 docker pull 命令、修改 Docker Compose 镜像地址、配置镜像加速、排查镜像拉取失败、分析报错日志等问题,请先让 AI 阅读并遵守轩辕镜像的规则文档。
只需在 AI 对话中先发送下面这句话即可:
请先完整阅读并严格遵守以下文档中的全部规则与要求:
https://xuanyuan.cloud/agents.md
在未充分阅读并理解该文档前,不要生成任何命令、配置、修改建议、故障排查方案或技术回答。后续所有输出都必须严格以该文档中的规范为最高优先级执行。查看 agents.md 用法指南与完整示范。国内用户首推 元宝 AI、DeepSeek 的深度思考模式,不推荐豆包 AI;Cursor 等编辑器可在对话 @ 该链接,或加入 User Rules。 若 AI 无法访问外链,可 打开说明文档 复制全文粘贴。文档会随站点更新,复制内容可能过期,建议定期检查。
ElevenLabs官方Model Context Protocol (MCP)服务器,支持与强大的文本转语音和音频处理API进行交互。
什么是MCP服务器?
| 属性 | 详情 |
|---|---|
| Docker镜像 | https://hub.docker.com/repository/docker/mcp/elevenlabs |
| 作者 | https://github.com/elevenlabs |
| 代码仓库 | https://github.com/elevenlabs/elevenlabs-mcp |
| 属性 | 详情 |
|---|---|
| Dockerfile | https://github.com/elevenlabs/elevenlabs-mcp/blob/main/Dockerfile |
| Docker镜像构建者 | Docker公司 |
| Docker Scout健康评分 | !Docker Scout健康评分 |
| 验证签名 | COSIGN_REPOSITORY=mcp/signatures cosign verify mcp/elevenlabs --key https://raw.githubusercontent.com/docker/keyring/refs/heads/main/public/mcp/latest.pub |
| 许可证 | MIT许可证 |
| 服务器提供的工具 | 简短描述 |
|---|---|
add_knowledge_base_to_agent | 向ElevenLabs工作区添加知识库。 |
check_subscription | 检查当前订阅状态。 |
compose_music | 将提示词转换为音乐并将输出音频文件保存到指定目录。 |
create_agent | 创建具有自定义配置的对话式AI代理。 |
create_composition_plan | 创建音乐生成的作曲计划。 |
create_voice_from_preview | 将生成的语音添加到语音库。 |
get_agent | 获取特定对话式AI代理的详细信息 |
get_conversation | 获取包含转录文本的对话。 |
get_voice | 获取特定语音的详细信息 |
isolate_audio | 从文件中分离音频。 |
list_agents | 列出所有可用的对话式AI代理 |
list_conversations | 列出代理对话。 |
list_models | 列出所有可用模型 |
list_phone_numbers | 列出与ElevenLabs账户关联的所有电话号码 |
make_outbound_call | 使用ElevenLabs代理拨打外呼电话。 |
play_audio | 播放音频文件。 |
search_voice_library | 搜索整个ElevenLabs语音库中的语音。 |
search_voices | 搜索用户ElevenLabs语音库中已添加的现有语音。 |
speech_to_speech | 使用提供的音频文件将音频从一种语音转换为另一种语音。 |
speech_to_text | 转录音频文件中的语音。 |
text_to_sound_effects | 将音效的文本描述转换为指定时长的音效。 |
text_to_speech | 使用指定语音将文本转换为语音。 |
text_to_voice | 从文本提示创建语音预览。 |
voice_clone | 使用提供的音频文件创建语音的即时克隆。 |
工具:add_knowledge_base_to_agent
向ElevenLabs工作区添加知识库。支持的类型包括epub、pdf、docx、txt、html。
⚠️ 成本警告:此工具会调用ElevenLabs API,可能产生费用。仅在用户明确请求时使用。
| 参数 | 类型 | 描述 |
|---|---|---|
agent_id | string | 要添加知识库的代理ID。 |
knowledge_base_name | string | 知识库名称。 |
input_file_path | string 可选 | 要添加到知识库的文件路径。 |
text | string 可选 | 要添加到知识库的文本。 |
url | string 可选 | 知识库的URL。 |
工具:check_subscription
检查当前订阅状态。可用于衡量API的使用情况。
工具:compose_music
将提示词转换为音乐并将输出音频文件保存到指定目录。 目录为可选,若未提供,输出文件将保存至$HOME/Desktop。
| 参数 | 类型 | 描述 |
|---|---|---|
composition_plan | string 可选 | 用于音乐生成的作曲计划。必须提供prompt或composition_plan之一。 |
music_length_ms | string 可选 | 生成音乐的时长(毫秒)。若提供composition_plan,则不可使用此参数。 |
output_directory | string 可选 | 保存输出音频文件的目录 |
prompt | string 可选 | 要转换为音乐的提示词。必须提供prompt或composition_plan之一。 |
工具:create_agent
创建具有自定义配置的对话式AI代理。
⚠️ 成本警告:此工具会调用ElevenLabs API,可能产生费用。仅在用户明确请求时使用。
| 参数 | 类型 | 描述 |
|---|---|---|
first_message | string | 代理的第一条消息,例如:"嗨,今天有什么可以帮您的吗?" |
name | string | 代理名称 |
system_prompt | string | 代理的系统提示词 |
asr_quality | string 可选 | ASR质量。high或low。 |
language | string 可选 | 代理的ISO 639-1语言代码 |
llm | string 可选 | 用于代理的LLM |
max_duration_seconds | integer 可选 | 对话的最大时长(秒)。默认为600秒(10分钟)。 |
max_tokens | string 可选 | 生成的最大令牌数。 |
model_id | string 可选 | 用于代理的ElevenLabs模型ID。 |
optimize_streaming_latency | integer 可选 | 优化流式传输延迟。范围为0到4。 |
record_voice | boolean 可选 | 是否录制代理的语音。 |
retention_days | integer 可选 | 代理数据的保留天数。 |
similarity_boost | number 可选 | 代理的相似度提升。范围为0到1。 |
stability | number 可选 | 代理的稳定性。范围为0到1。 |
temperature | number 可选 | 代理的温度值。温度越低,代理的响应越具确定性。范围为0到1。 |
turn_timeout | integer 可选 | 代理响应的超时时间(秒)。默认为7秒。 |
voice_id | string 可选 | 用于代理的语音ID |
工具:create_composition_plan
创建音乐生成的作曲计划。使用此端点不消耗积分,但根据您的等级可能有速率限制。作曲计划可用于compose_music工具生成音乐。
| 参数 | 类型 | 描述 |
|---|---|---|
prompt | string | 用于创建作曲计划的提示词 |
music_length_ms | string 可选 | 生成的作曲计划时长(毫秒)。必须在***ms到300000ms之间。可选 - 若未提供,模型将根据提示词选择时长。 |
source_composition_plan | string 可选 | 用于创建新作曲计划的可选源作曲计划 |
工具:create_voice_from_preview
将生成的语音添加到语音库。使用text_to_voice工具返回的语音ID。
⚠️ 成本警告:此工具会调用ElevenLabs API,可能产生费用。仅在用户明确请求时使用。
| 参数 | 类型 | 描述 |
|---|---|---|
generated_voice_id | string | |
voice_description | string | |
voice_name | string |
工具:get_agent
获取特定对话式AI代理的详细信息
| 参数 | 类型 | 描述 |
|---|---|---|
agent_id | string |
工具:get_conversation
获取包含转录文本的对话。返回:对话详情和完整转录文本。使用场景:分析已完成的代理对话。
| 参数 | 类型 | 描述 |
|---|---|---|
conversation_id | string | 要获取的对话的唯一标识符,可通过list_conversations工具获取ID。 |
工具:get_voice
获取特定语音的详细信息
| 参数 | 类型 | 描述 |
|---|---|---|
voice_id | string |
工具:isolate_audio
从文件中分离音频。将输出文件保存到目录(默认:$HOME/Desktop)。
⚠️ 成本警告:此工具会调用ElevenLabs API,可能产生费用。仅在用户明确请求时使用。
| 参数 | 类型 | 描述 |
|---|---|---|
input_file_path | string | |
output_directory | string 可选 |
工具:list_agents
列出所有可用的对话式AI代理
工具:list_conversations
列出代理对话。返回:包含元数据的对话列表。使用场景:查询对话历史时。
| 参数 | 类型 | 描述 |
|---|---|---|
agent_id | string 可选 | |
call_start_after_unix | string 可选 | |
call_start_before_unix | string 可选 | |
cursor | string 可选 | |
max_length | integer 可选 | |
page_size | integer 可选 |
工具:list_models
列出所有可用模型
工具:list_phone_numbers
列出与ElevenLabs账户关联的所有电话号码
工具:make_outbound_call
使用ElevenLabs代理拨打外呼电话。自动检测提供商类型(Twilio或SIP中继)并使用相应的API。
⚠️ 成本警告:此工具会调用ElevenLabs API,可能产生费用。仅在用户明确请求时使用。
| 参数 | 类型 | 描述 |
|---|---|---|
agent_id | string | 处理呼叫的代理ID |
agent_phone_number_id | string | 用于呼叫的电话号码ID |
to_number | string | 要拨打的电话号码(E.164格式:+1xxxxxxxxxx) |
工具:play_audio
播放音频文件。支持WAV和MP3格式。
| 参数 | 类型 | 描述 |
|---|---|---|
input_file_path | string |
工具:search_voice_library
搜索整个ElevenLabs语音库中的语音。
| 参数 | 类型 | 描述 |
|---|---|---|
page | integer 可选 | 要返回的页码(从0开始) |
page_size | integer 可选 | 每页返回的语音数量(1-100) |
search | string 可选 | 用于筛选语音的搜索词 |
工具:search_voices
搜索用户ElevenLabs语音库中已添加的现有语音。 在名称、描述、标签和类别中搜索。
| 参数 | 类型 | 描述 |
|---|---|---|
search | string 可选 | 用于筛选语音的搜索词。在名称、描述、标签和类别中搜索。 |
sort | string 可选 | 排序字段。较旧的语音可能不支持created_at_unix。 |
sort_direction | string 可选 | 排序顺序,升序或降序。 |
工具:speech_to_speech
使用提供的音频文件将音频从一种语音转换为另一种语音。将输出文件保存到目录(默认:$HOME/Desktop)。
⚠️ 成本警告:此工具会调用ElevenLabs API,可能产生费用。仅在用户明确请求时使用。
| 参数 | 类型 | 描述 |
|---|---|---|
input_file_path | string | |
output_directory | string 可选 | |
voice_name | string 可选 |
工具:speech_to_text
转录音频文件中的语音。当save_transcript_to_file=True时:将输出文件保存到目录(默认:$HOME/Desktop)。当return_transcript_to_client_directly=True时,无论输出模式如何,始终直接返回文本。
⚠️ 成本警告:此工具会调用ElevenLabs API,可能产生费用。仅在用户明确请求时使用。
| 参数 | 类型 | 描述 |
|---|---|---|
input_file_path | string | |
diarize | boolean 可选 | 是否对音频文件进行说话人分离。若为True,转录文本中将标注当前说话人。 |
language_code | string 可选 | 转录的ISO 639-3语言代码。若未提供,将自动检测语言。 |
output_directory | string 可选 | 保存文件的目录(仅在保存文件时使用)。 |
return_transcript_to_client_directly | boolean 可选 | 是否直接向客户端返回转录文本。 |
save_transcript_to_file | boolean 可选 | 是否将转录文本保存到文件。 |
工具:text_to_sound_effects
将音效的文本描述转换为指定时长的音效。将输出文件保存到目录(默认:$HOME/Desktop)。
时长必须在0.5到5秒之间。 ⚠️ 成本警告:此工具会调用ElevenLabs API,可能产生费用。仅在用户明确请求时使用。
| 参数 | 类型 | 描述 |
|---|---|---|
text | string | 音效的文本描述 |
duration_seconds | number 可选 | 音效时长(秒) |
loop | boolean 可选 | 是否循环音效。默认为False。 |
output_directory | string 可选 | 保存文件的目录(仅在保存文件时使用)。 |
output_format | string 可选 |
工具:text_to_speech
使用指定语音将文本转换为语音。将输出文件保存到目录(默认:$HOME/Desktop)。
只能提供voice_id或voice_name之一。若均未提供,将使用默认语音。 ⚠️ 成本警告:此工具会调用ElevenLabs API,可能产生费用。仅在用户明确请求时使用。
| 参数 | 类型 | 描述 |
|---|---|---|
text | string | |
language | string 可选 | 语音的ISO 639-1语言代码。 |
model_id | string 可选 | |
output_directory | string 可选 | |
output_format | string 可选 | |
similarity_boost | number 可选 | |
speed | number 可选 | |
stability | number 可选 | |
style | number 可选 | |
use_speaker_boost | boolean 可选 | |
voice_id | string 可选 | |
voice_name | string 可选 |
工具:text_to_voice
从文本提示创建语音预览。创建三个略有不同的预览。将输出文件保存到目录(默认:$HOME/Desktop)。
若未提供文本,工具将自动生成文本。 语音预览文件保存格式:voice_design_(generated_voice_id)_(timestamp).mp3 示例文件名:voice_design_Ya2J5uIa5Pq14DNPsbC1_20250403_***.mp3 ⚠️ 成本警告:此工具会调用ElevenLabs API,可能产生费用。仅在用户明确请求时使用。
| 参数 | 类型 | 描述 |
|---|---|---|
voice_description | string | |
output_directory | string 可选 | |
text | string 可选 |
工具:voice_clone
使用提供的音频文件创建语音的即时克隆。
⚠️ 成本警告:此工具会调用ElevenLabs API,可能产生费用。仅在用户明确请求时使用。
| 参数 | 类型 | 描述 |
|---|---|---|
files | array | |
name | string | |
description | string 可选 |
json{ "mcpServers": { "elevenlabs": { "command": "docker", "args":
您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 标签列表页面。
来自真实用户的反馈,见证轩辕镜像的优质服务