如果你使用 DeepSeek、元宝 AI、Copilot、ChatGPT 等 AI 工具,协助配置轩辕镜像、编写 docker pull 命令、修改 Docker Compose 镜像地址、配置镜像加速、排查镜像拉取失败、分析报错日志等问题,请先让 AI 阅读并遵守轩辕镜像的规则文档。
只需在 AI 对话中先发送下面这句话即可:
请先完整阅读并严格遵守以下文档中的全部规则与要求:
https://xuanyuan.cloud/agents.md
在未充分阅读并理解该文档前,不要生成任何命令、配置、修改建议、故障排查方案或技术回答。后续所有输出都必须严格以该文档中的规范为最高优先级执行。查看 agents.md 用法指南与完整示范。国内用户首推 元宝 AI、DeepSeek 的深度思考模式,不推荐豆包 AI;Cursor 等编辑器可在对话 @ 该链接,或加入 User Rules。 若 AI 无法访问外链,可 打开说明文档 复制全文粘贴。文档会随站点更新,复制内容可能过期,建议定期检查。
🐸TTS 是一个用于高级文本转语音(Text-to-Speech)生成的库。
🚀 支持 1100 多种语言的预训练模型。
🛠️ 用于训练新模型和微调任意语言现有模型的工具。
📚 用于数据集分析和整理的实用程序。
请使用我们的专用渠道进行提问和讨论。公开分享的帮助更有价值,能让更多人从中受益。
| 类型 | 平台 |
|---|---|
| 🚨 错误报告 | https://github.com/coqui-ai/tts/issues |
| 🎁 功能请求与想法 | https://github.com/coqui-ai/tts/issues |
| 👩💻 使用问题 | https://github.com/coqui-ai/TTS/discussions |
| 🗯 一般讨论 | https://github.com/coqui-ai/TTS/discussions 或 *** |
| 类型 | 链接 |
|---|---|
| 💼 文档 | ReadTheDocs |
| 💾 安装 | https://github.com/coqui-ai/TTS/tree/dev#installation |
| 👩💻 贡献指南 | https://github.com/coqui-ai/TTS/blob/main/CONTRIBUTING.md |
| 📌 路线图 | https://github.com/coqui-ai/TTS/issues/378 |
| 🚀 已发布模型 | https://github.com/coqui-ai/TTS/releases 和 https://github.com/coqui-ai/TTS/wiki/Experimental-Released-Models |
| 📰 论文 | https://github.com/erogol/TTS-papers |
带下划线的 "TTS*" 和 "Judy*" 是 内部 🐸TTS 模型,未开源发布。列出这些模型是为了展示潜在能力。以点开头的模型(.Jofish、.Abe 和 .Janice)是真实人类语音。
Trainer API。dataset_analysis 下用于整理文本转语音数据集的工具。您也可以帮助我们实现更多模型。
🐸TTS 在 Ubuntu 18.04 系统,Python >= 3.9 环境下测试通过。
您可以在 此处 找到语言 ISO 代码,在 https://github.com/***research/fairseq/tree/main/examples/mms 了解 Fairseq 模型。
# 带实时语音转换的 TTS
api = TTS("tts_models/deu/fairseq/vits")
api.tts_with_vc_to_file(
"Wie sage ich auf Italienisch, dass ich dich liebe?",
speaker_wav="target/speaker.wav",
file_path="output.wav"
)
tts通过命令行合成语音。
您可以使用训练好的模型,或从提供的列表中选择模型。
如果未指定任何模型,将默认使用基于 LJSpeech 的英文模型。
单说话人模型
$ tts --list_models
获取模型信息(适用于 tts_models 和 vocoder_models):
按类型/名称查询: model_info_by_name 使用 --list_models 输出中的名称。
$ tts --model_info_by_name " / / / "
例如:
$ tts --model_info_by_name tts_models/tr/common-voice/glow-tts
$ tts --model_info_by_name vocoder_models/en/ljspeech/hifigan_v2
$ tts --model_info_by_idx " / "
例如:
$ tts --model_info_by_idx tts_models/3
$ tts --model_info_by_name " / / / "
$ tts --text "Text for TTS" --out_path output/path/speech.wav
$ tts --text "Text for TTS" --pipe_out --out_path output/path/speech.wav | aplay
$ tts --text "Text for TTS" --model_name " / / / " --out_path output/path/speech.wav
例如:
$ tts --text "Text for TTS" --model_name "tts_models/en/ljspeech/glow-tts" --out_path output/path/speech.wav
$ tts --text "Text for TTS" --model_name " / / / " --vocoder_name " / / / " --out_path output/path/speech.wav
例如:
$ tts --text "Text for TTS" --model_name "tts_models/en/ljspeech/glow-tts" --vocoder_name "vocoder_models/en/ljspeech/univnet" --out_path output/path/speech.wav
$ tts --text "Text for TTS" --model_path path/to/model.pth --config_path path/to/config.json --out_path output/path/speech.wav
$ tts --text "Text for TTS" --model_path path/to/model.pth --config_path path/to/config.json --out_path output/path/speech.wav
--vocoder_path path/to/vocoder.pth --vocoder_config_path path/to/vocoder_config.json
多说话人模型
$ tts --model_name " / / " --list_speaker_idxs
$ tts --text "Text for TTS." --out_path output/path/speech.wav --model_name " / / " --speaker_idx
$ tts --text "Text for TTS" --out_path output/path/speech.wav --model_path path/to/model.pth --config_path path/to/config.json --speakers_file_path path/to/speaker.json --speaker_idx
$ tts --out_path output/path/speech.wav --model_name " / / " --source_wav --target_wav
|- notebooks/ (用于模型评估、参数选择和数据分析的 Jupyter 笔记本。)
|- utils/ (通用工具。)
|- TTS
|- bin/ (所有可执行文件的文件夹。)
|- train*.py (训练目标模型。)
|- ...
|- tts/ (文本转语音模型)
|- layers/ (模型层定义)
|- models/ (模型定义)
|- utils/ (模型特定工具。)
|- speaker_encoder/ (说话人编码器模型。)
|- (同上)
|- vocoder/ (声码器模型。)
|- (同上)
来自真实用户的反馈,见证轩辕镜像的优质服务