
ElevenLabs***Model Context Protocol (MCP)服务器,支持与强大的文本转语音和音频处理API进行交互。
什么是MCP服务器?
| 属性 | 详情 |
|---|---|
| Docker镜像 | mcp/elevenlabs |
| 作者 | elevenlabs |
| 代码仓库 | [***] |
| 属性 | 详情 |
|---|---|
| Dockerfile | [***] |
| Docker镜像构建者 | Docker公司 |
| Docker Scout健康评分 | !Docker Scout健康评分 |
| 验证签名 | COSIGN_REPOSITORY=mcp/signatures cosign verify mcp/elevenlabs --key [***] |
| 许可证 | MIT许可证 |
| 服务器提供的工具 | 简短描述 |
|---|---|
add_knowledge_base_to_agent | 向ElevenLabs工作区添加知识库。 |
check_subscription | 检查当前订阅状态。 |
compose_music | 将提示词转换为音乐并将输出音频文件保存到指定目录。 |
create_agent | 创建具有自定义配置的对话式AI代理。 |
create_composition_plan | 创建音乐生成的作曲计划。 |
create_voice_from_preview | 将生成的语音添加到语音库。 |
get_agent | 获取特定对话式AI代理的详细信息 |
get_conversation | 获取包含转录文本的对话。 |
get_voice | 获取特定语音的详细信息 |
isolate_audio | 从文件中分离音频。 |
list_agents | 列出所有可用的对话式AI代理 |
list_conversations | 列出代理对话。 |
list_models | 列出所有可用模型 |
list_phone_numbers | 列出与ElevenLabs账户关联的所有电话号码 |
make_outbound_call | 使用ElevenLabs代理拨打外呼电话。 |
play_audio | 播放音频文件。 |
search_voice_library | 搜索整个ElevenLabs语音库中的语音。 |
search_voices | 搜索用户ElevenLabs语音库中已添加的现有语音。 |
speech_to_speech | 使用提供的音频文件将音频从一种语音转换为另一种语音。 |
speech_to_text | 转录音频文件中的语音。 |
text_to_sound_effects | 将音效的文本描述转换为指定时长的音效。 |
text_to_speech | 使用指定语音将文本转换为语音。 |
text_to_voice | 从文本提示创建语音预览。 |
voice_clone | 使用提供的音频文件创建语音的即时克隆。 |
add_knowledge_base_to_agent向ElevenLabs工作区添加知识库。支持的类型包括epub、pdf、docx、txt、html。
⚠️ 成本警告:此工具会调用ElevenLabs API,可能产生费用。仅在用户明确请求时使用。
| 参数 | 类型 | 描述 |
|---|---|---|
agent_id | string | 要添加知识库的代理ID。 |
knowledge_base_name | string | 知识库名称。 |
input_file_path | string 可选 | 要添加到知识库的文件路径。 |
text | string 可选 | 要添加到知识库的文本。 |
url | string 可选 | 知识库的URL。 |
check_subscription检查当前订阅状态。可用于衡量API的使用情况。
compose_music将提示词转换为音乐并将输出音频文件保存到指定目录。 目录为可选,若未提供,输出文件将保存至$HOME/Desktop。
| 参数 | 类型 | 描述 |
|---|---|---|
composition_plan | string 可选 | 用于音乐生成的作曲计划。必须提供prompt或composition_plan之一。 |
music_length_ms | string 可选 | 生成音乐的时长(毫秒)。若提供composition_plan,则不可使用此参数。 |
output_directory | string 可选 | 保存输出音频文件的目录 |
prompt | string 可选 | 要转换为音乐的提示词。必须提供prompt或composition_plan之一。 |
create_agent创建具有自定义配置的对话式AI代理。
⚠️ 成本警告:此工具会调用ElevenLabs API,可能产生费用。仅在用户明确请求时使用。
| 参数 | 类型 | 描述 |
|---|---|---|
first_message | string | 代理的第一条消息,例如:"嗨,今天有什么可以帮您的吗?" |
name | string | 代理名称 |
system_prompt | string | 代理的系统提示词 |
asr_quality | string 可选 | ASR质量。high或low。 |
language | string 可选 | 代理的ISO 639-1语言代码 |
llm | string 可选 | 用于代理的LLM |
max_duration_seconds | integer 可选 | 对话的最大时长(秒)。默认为600秒(10分钟)。 |
max_tokens | string 可选 | 生成的最大令牌数。 |
model_id | string 可选 | 用于代理的ElevenLabs模型ID。 |
optimize_streaming_latency | integer 可选 | 优化流式传输延迟。范围为0到4。 |
record_voice | boolean 可选 | 是否录制代理的语音。 |
retention_days | integer 可选 | 代理数据的保留天数。 |
similarity_boost | number 可选 | 代理的相似度提升。范围为0到1。 |
stability | number 可选 | 代理的稳定性。范围为0到1。 |
temperature | number 可选 | 代理的温度值。温度越低,代理的响应越具确定性。范围为0到1。 |
turn_timeout | integer 可选 | 代理响应的超时时间(秒)。默认为7秒。 |
voice_id | string 可选 | 用于代理的语音ID |
create_composition_plan创建音乐生成的作曲计划。使用此端点不消耗积分,但根据您的等级可能有速率限制。作曲计划可用于compose_music工具生成音乐。
| 参数 | 类型 | 描述 |
|---|---|---|
prompt | string | 用于创建作曲计划的提示词 |
music_length_ms | string 可选 | 生成的作曲计划时长(毫秒)。必须在***ms到300000ms之间。可选 - 若未提供,模型将根据提示词选择时长。 |
source_composition_plan | string 可选 | 用于创建新作曲计划的可选源作曲计划 |
create_voice_from_preview将生成的语音添加到语音库。使用text_to_voice工具返回的语音ID。
⚠️ 成本警告:此工具会调用ElevenLabs API,可能产生费用。仅在用户明确请求时使用。
| 参数 | 类型 | 描述 |
|---|---|---|
generated_voice_id | string | |
voice_description | string | |
voice_name | string |
get_agent获取特定对话式AI代理的详细信息
| 参数 | 类型 | 描述 |
|---|---|---|
agent_id | string |
get_conversation获取包含转录文本的对话。返回:对话详情和完整转录文本。使用场景:分析已完成的代理对话。
| 参数 | 类型 | 描述 |
|---|---|---|
conversation_id | string | 要获取的对话的唯一标识符,可通过list_conversations工具获取ID。 |
get_voice获取特定语音的详细信息
| 参数 | 类型 | 描述 |
|---|---|---|
voice_id | string |
isolate_audio从文件中分离音频。将输出文件保存到目录(默认:$HOME/Desktop)。
⚠️ 成本警告:此工具会调用ElevenLabs API,可能产生费用。仅在用户明确请求时使用。
| 参数 | 类型 | 描述 |
|---|---|---|
input_file_path | string | |
output_directory | string 可选 |
list_agents列出所有可用的对话式AI代理
list_conversations列出代理对话。返回:包含元数据的对话列表。使用场景:查询对话历史时。
| 参数 | 类型 | 描述 |
|---|---|---|
agent_id | string 可选 | |
call_start_after_unix | string 可选 | |
call_start_before_unix | string 可选 | |
cursor | string 可选 | |
max_length | integer 可选 | |
page_size | integer 可选 |
list_models列出所有可用模型
list_phone_numbers列出与ElevenLabs账户关联的所有电话号码
make_outbound_call使用ElevenLabs代理拨打外呼电话。自动检测提供商类型(Twilio或SIP中继)并使用相应的API。
⚠️ 成本警告:此工具会调用ElevenLabs API,可能产生费用。仅在用户明确请求时使用。
| 参数 | 类型 | 描述 |
|---|---|---|
agent_id | string | 处理呼叫的代理ID |
agent_phone_number_id | string | 用于呼叫的电话号码ID |
to_number | string | 要拨打的电话号码(E.164格式:+1xxxxxxxxxx) |
play_audio播放音频文件。支持WAV和MP3格式。
| 参数 | 类型 | 描述 |
|---|---|---|
input_file_path | string |
search_voice_library搜索整个ElevenLabs语音库中的语音。
| 参数 | 类型 | 描述 |
|---|---|---|
page | integer 可选 | 要返回的页码(从0开始) |
page_size | integer 可选 | 每页返回的语音数量(1-100) |
search | string 可选 | 用于筛选语音的搜索词 |
search_voices搜索用户ElevenLabs语音库中已添加的现有语音。 在名称、描述、标签和类别中搜索。
| 参数 | 类型 | 描述 |
|---|---|---|
search | string 可选 | 用于筛选语音的搜索词。在名称、描述、标签和类别中搜索。 |
sort | string 可选 | 排序字段。较旧的语音可能不支持created_at_unix。 |
sort_direction | string 可选 | 排序顺序,升序或降序。 |
speech_to_speech使用提供的音频文件将音频从一种语音转换为另一种语音。将输出文件保存到目录(默认:$HOME/Desktop)。
⚠️ 成本警告:此工具会调用ElevenLabs API,可能产生费用。仅在用户明确请求时使用。
| 参数 | 类型 | 描述 |
|---|---|---|
input_file_path | string | |
output_directory | string 可选 | |
voice_name | string 可选 |
speech_to_text转录音频文件中的语音。当save_transcript_to_file=True时:将输出文件保存到目录(默认:$HOME/Desktop)。当return_transcript_to_client_directly=True时,无论输出模式如何,始终直接返回文本。
⚠️ 成本警告:此工具会调用ElevenLabs API,可能产生费用。仅在用户明确请求时使用。
| 参数 | 类型 | 描述 |
|---|---|---|
input_file_path | string | |
diarize | boolean 可选 | 是否对音频文件进行说话人分离。若为True,转录文本中将标注当前说话人。 |
language_code | string 可选 | 转录的ISO 639-3语言代码。若未提供,将自动检测语言。 |
output_directory | string 可选 | 保存文件的目录(仅在保存文件时使用)。 |
return_transcript_to_client_directly | boolean 可选 | 是否直接向客户端返回转录文本。 |
save_transcript_to_file | boolean 可选 | 是否将转录文本保存到文件。 |
text_to_sound_effects将音效的文本描述转换为指定时长的音效。将输出文件保存到目录(默认:$HOME/Desktop)。
时长必须在0.5到5秒之间。 ⚠️ 成本警告:此工具会调用ElevenLabs API,可能产生费用。仅在用户明确请求时使用。
| 参数 | 类型 | 描述 |
|---|---|---|
text | string | 音效的文本描述 |
duration_seconds | number 可选 | 音效时长(秒) |
loop | boolean 可选 | 是否循环音效。默认为False。 |
output_directory | string 可选 | 保存文件的目录(仅在保存文件时使用)。 |
output_format | string 可选 |
text_to_speech使用指定语音将文本转换为语音。将输出文件保存到目录(默认:$HOME/Desktop)。
只能提供voice_id或voice_name之一。若均未提供,将使用默认语音。 ⚠️ 成本警告:此工具会调用ElevenLabs API,可能产生费用。仅在用户明确请求时使用。
| 参数 | 类型 | 描述 |
|---|---|---|
text | string | |
language | string 可选 | 语音的ISO 639-1语言代码。 |
model_id | string 可选 | |
output_directory | string 可选 | |
output_format | string 可选 | |
similarity_boost | number 可选 | |
speed | number 可选 | |
stability | number 可选 | |
style | number 可选 | |
use_speaker_boost | boolean 可选 | |
voice_id | string 可选 | |
voice_name | string 可选 |
text_to_voice从文本提示创建语音预览。创建三个略有不同的预览。将输出文件保存到目录(默认:$HOME/Desktop)。
若未提供文本,工具将自动生成文本。 语音预览文件保存格式:voice_design_(generated_voice_id)_(timestamp).mp3 示例文件名:voice_design_Ya2J5uIa5Pq14DNPsbC1_20250403_***.mp3 ⚠️ 成本警告:此工具会调用ElevenLabs API,可能产生费用。仅在用户明确请求时使用。
| 参数 | 类型 | 描述 |
|---|---|---|
voice_description | string | |
output_directory | string 可选 | |
text | string 可选 |
voice_clone使用提供的音频文件创建语音的即时克隆。
⚠️ 成本警告:此工具会调用ElevenLabs API,可能产生费用。仅在用户明确请求时使用。
| 参数 | 类型 | 描述 |
|---|---|---|
files | array | |
name | string | |
description | string 可选 |
json{ "mcpServers": { "elevenlabs": { "command": "docker", "args":





来自真实用户的反馈,见证轩辕镜像的优质服务
免费版仅支持 Docker Hub 加速,不承诺可用性和速度;专业版支持更多镜像源,保证可用性和稳定速度,提供优先客服响应。
免费版仅支持 docker.io;专业版支持 docker.io、gcr.io、ghcr.io、registry.k8s.io、nvcr.io、quay.io、mcr.microsoft.com、docker.elastic.co 等。
当返回 402 Payment Required 错误时,表示流量已耗尽,需要充值流量包以恢复服务。
通常由 Docker 版本过低导致,需要升级到 20.x 或更高版本以支持 V2 协议。
先检查 Docker 版本,版本过低则升级;版本正常则验证镜像信息是否正确。
使用 docker tag 命令为镜像打上新标签,去掉域名前缀,使镜像名称更简洁。
探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式
通过 Docker 登录认证访问私有仓库
在 Linux 系统配置镜像加速服务
在 Docker Desktop 配置镜像加速
Docker Compose 项目配置加速
Kubernetes 集群配置 Containerd
在宝塔面板一键配置镜像加速
Synology 群晖 NAS 配置加速
飞牛 fnOS 系统配置镜像加速
极空间 NAS 系统配置加速服务
爱快 iKuai 路由系统配置加速
绿联 NAS 系统配置镜像加速
QNAP 威联通 NAS 配置加速
Podman 容器引擎配置加速
HPC 科学计算容器配置加速
ghcr、Quay、nvcr 等镜像仓库
无需登录使用专属域名加速
需要其他帮助?请查看我们的 常见问题 或 官方QQ群: 13763429