🐸TTS 是一个用于高级文本转语音(Text-to-Speech)生成的库。
🚀 支持 1100 多种语言的预训练模型。
🛠️ 用于训练新模型和微调任意语言现有模型的工具。
📚 用于数据集分析和整理的实用程序。
请使用我们的专用渠道进行提问和讨论。公开分享的帮助更有价值,能让更多人从中受益。
| 类型 | 平台 |
|---|---|
| 🚨 错误报告 | https://github.com/coqui-ai/tts/issues |
| 🎁 功能请求与想法 | https://github.com/coqui-ai/tts/issues |
| 👩💻 使用问题 | https://github.com/coqui-ai/TTS/discussions |
| 🗯 一般讨论 | https://github.com/coqui-ai/TTS/discussions 或 *** |
| 类型 | 链接 |
|---|---|
| 💼 文档 | ReadTheDocs |
| 💾 安装 | https://github.com/coqui-ai/TTS/tree/dev#installation |
| 👩💻 贡献指南 | https://github.com/coqui-ai/TTS/blob/main/CONTRIBUTING.md |
| 📌 路线图 | https://github.com/coqui-ai/TTS/issues/378 |
| 🚀 已发布模型 | https://github.com/coqui-ai/TTS/releases 和 https://github.com/coqui-ai/TTS/wiki/Experimental-Released-Models |
| 📰 论文 | https://github.com/erogol/TTS-papers |
带下划线的 "TTS*" 和 "Judy*" 是 内部 🐸TTS 模型,未开源发布。列出这些模型是为了展示潜在能力。以点开头的模型(.Jofish、.Abe 和 .Janice)是真实人类语音。
Trainer API。dataset_analysis 下用于整理文本转语音数据集的工具。您也可以帮助我们实现更多模型。
🐸TTS 在 Ubuntu 18.04 系统,Python >= 3.9 环境下测试通过。
您可以在 此处 找到语言 ISO 代码,在 https://github.com/***research/fairseq/tree/main/examples/mms 了解 Fairseq 模型。
# 带实时语音转换的 TTS
api = TTS("tts_models/deu/fairseq/vits")
api.tts_with_vc_to_file(
"Wie sage ich auf Italienisch, dass ich dich liebe?",
speaker_wav="target/speaker.wav",
file_path="output.wav"
)
tts通过命令行合成语音。
您可以使用训练好的模型,或从提供的列表中选择模型。
如果未指定任何模型,将默认使用基于 LJSpeech 的英文模型。
$ tts --list_models
获取模型信息(适用于 tts_models 和 vocoder_models):
按类型/名称查询: model_info_by_name 使用 --list_models 输出中的名称。
$ tts --model_info_by_name " / / / "
例如:
$ tts --model_info_by_name tts_models/tr/common-voice/glow-tts
$ tts --model_info_by_name vocoder_models/en/ljspeech/hifigan_v2
$ tts --model_info_by_idx " / "
例如:
$ tts --model_info_by_idx tts_models/3
$ tts --model_info_by_name " / / / "
$ tts --text "Text for TTS" --out_path output/path/speech.wav
$ tts --text "Text for TTS" --pipe_out --out_path output/path/speech.wav | aplay
$ tts --text "Text for TTS" --model_name " / / / " --out_path output/path/speech.wav
例如:
$ tts --text "Text for TTS" --model_name "tts_models/en/ljspeech/glow-tts" --out_path output/path/speech.wav
$ tts --text "Text for TTS" --model_name " / / / " --vocoder_name " / / / " --out_path output/path/speech.wav
例如:
$ tts --text "Text for TTS" --model_name "tts_models/en/ljspeech/glow-tts" --vocoder_name "vocoder_models/en/ljspeech/univnet" --out_path output/path/speech.wav
$ tts --text "Text for TTS" --model_path path/to/model.pth --config_path path/to/config.json --out_path output/path/speech.wav
$ tts --text "Text for TTS" --model_path path/to/model.pth --config_path path/to/config.json --out_path output/path/speech.wav
--vocoder_path path/to/vocoder.pth --vocoder_config_path path/to/vocoder_config.json
$ tts --model_name " / / " --list_speaker_idxs
$ tts --text "Text for TTS." --out_path output/path/speech.wav --model_name " / / " --speaker_idx
$ tts --text "Text for TTS" --out_path output/path/speech.wav --model_path path/to/model.pth --config_path path/to/config.json --speakers_file_path path/to/speaker.json --speaker_idx
$ tts --out_path output/path/speech.wav --model_name " / / " --source_wav --target_wav
|- notebooks/ (用于模型评估、参数选择和数据分析的 Jupyter 笔记本。)
|- utils/ (通用工具。)
|- TTS
|- bin/ (所有可执行文件的文件夹。)
|- train*.py (训练目标模型。)
|- ...
|- tts/ (文本转语音模型)
|- layers/ (模型层定义)
|- models/ (模型定义)
|- utils/ (模型特定工具。)
|- speaker_encoder/ (说话人编码器模型。)
|- (同上)
|- vocoder/ (声码器模型。)
|- (同上)
探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式
通过 Docker 登录认证访问私有仓库
无需登录使用专属域名
Kubernetes 集群配置 Containerd
K3s 轻量级 Kubernetes 镜像加速
VS Code Dev Containers 配置
Podman 容器引擎配置
HPC 科学计算容器配置
ghcr、Quay、nvcr 等镜像仓库
Harbor Proxy Repository 对接专属域名
Portainer Registries 加速拉取
Nexus3 Docker Proxy 内网缓存
需要其他帮助?请查看我们的 常见问题Docker 镜像访问常见问题解答 或 提交工单
docker search 限制
站内搜不到镜像
离线 save/load
插件要用 plugin install
WSL 拉取慢
安全与 digest
新手拉取配置
镜像合规机制
不支持 push
manifest unknown
no matching manifest(架构)
invalid tar header(解压)
TLS 证书失败
DNS 超时
域名连通性排查
410 Gone 排查
402 与流量用尽
401 认证失败
429 限流
D-Bus 凭证提示
413 与超大单层
来自真实用户的反馈,见证轩辕镜像的优质服务