本站支持搜索的镜像仓库:Docker Hub、gcr.io、ghcr.io、quay.io、k8s.gcr.io、registry.gcr.io、elastic.co、mcr.microsoft.com

Fish Speech(现更名为OpenAudio)是一个开源的多语言文本转语音(TTS)工具,支持语音克隆功能。该Docker镜像提供了便捷的部署方式,让用户能够快速体验和集成高质量的文本转语音技术。OpenAudio系列模型在TTS-Arena2基准测试中排名第一,具备卓越的语音合成质量和多语言支持能力。
OpenAudio S1模型在Seed TTS评估指标中表现优异,在英文文本上实现了0.008 WER(词错误率)和0.004 CER(字符错误率),显著优于先前模型。
| 模型 | 词错误率 (WER) | 字符错误率 (CER) | 说话人相似度 |
|---|---|---|---|
| S1 | 0.008 | 0.004 | 0.332 |
| S1-mini | 0.011 | 0.005 | 0.380 |
支持多种情感、语调和特殊标记来增强语音合成:
| 模型 | 大小 | 可用性 | 特点 |
|---|---|---|---|
| S1 | 4B参数 | fish.audio | 全功能旗舰模型 |
| S1-mini | 0.5B参数 | Hugging Face | 精简版,保留核心功能 |
docker run -p 7860:7860 --name fish-speech fishaudio/fish-speech
访问 http://localhost:7860 即可使用Web界面。
docker run --gpus all -p 7860:7860 --name fish-speech fishaudio/fish-speech
docker run -d --gpus all -p 7860:7860 --name fish-speech fishaudio/fish-speech
创建 docker-compose.yml 文件:
version: '3.8' services: fish-speech: image: fishaudio/fish-speech container_name: fish-speech restart: unless-stopped ports: - "7860:7860" # Web UI端口 - "5000:5000" # API端口 volumes: - ./data:/app/data # 数据持久化 - ./models:/app/models # 模型文件 environment: - MODEL_TYPE=s1-mini # 模型类型: s1 或 s1-mini - ENABLE_API=true # 启用API服务 - CORS_ALLOWED_ORIGINS=* # CORS设置 deploy: resources: reservations: devices: - driver: nvidia count: 1 capabilities: [gpu]
启动服务:
docker-compose up -d
| 环境变量 | 说明 | 默认值 | 可选值 |
|---|---|---|---|
MODEL_TYPE | 模型类型选择 | s1-mini | s1, s1-mini |
ENABLE_WEBUI | 是否启用Web UI | true | true, false |
ENABLE_API | 是否启用API服务 | false | true, false |
WEBUI_PORT | Web UI端口 | 7860 | 1-65535 |
API_PORT | API服务端口 | 5000 | 1-65535 |
CORS_ALLOWED_ORIGINS | CORS允许的源 | * | 具体域名或* |
LOG_LEVEL | 日志级别 | info | debug, info, warning, error |
MAX_BATCH_SIZE | 最大批处理大小 | 4 | 正整数 |
CACHE_DIR | 缓存目录 | /app/cache | 容器内路径 |
为避免每次启动重新下载模型,可以将模型目录挂载到宿主机:
docker run --gpus all -p 7860:7860 \ -v ./fish-speech-models:/app/models \ --name fish-speech fishaudio/fish-speech
启用API后,可以通过HTTP请求调用TTS服务:
curl -X POST http://localhost:5000/tts \ -H "Content-Type: application/json" \ -d '{ "text": "你好,这是Fish Speech的API示例。", "speaker_id": 0, "emotion": "neutral", "speed": 1.0, "pitch": 0.0 }' --output output.wav
声明:我们不对代码库的任何非法使用承担责任。请参考当地关于DMCA和其他相关的规定。
@misc{fish-speech-v1.4, title={Fish-Speech: Leveraging Large Language Models for Advanced Multilingual Text-to-Speech Synthesis}, author={Shijia Liao and Yuxuan Wang and Tianyu Li and Yifan Cheng and Ruoyi Zhang and Rongzhi Zhou and Yijin Xing}, year={2024}, eprint={2411.01156}, archivePrefix={arXiv}, primaryClass={cs.SD}, url={[***]}, }
免费版仅支持 Docker Hub 加速,不承诺可用性和速度;专业版支持更多镜像源,保证可用性和稳定速度,提供优先客服响应。
免费版仅支持 docker.io;专业版支持 docker.io、gcr.io、ghcr.io、registry.k8s.io、nvcr.io、quay.io、mcr.microsoft.com、docker.elastic.co 等。
当返回 402 Payment Required 错误时,表示流量已耗尽,需要充值流量包以恢复服务。
通常由 Docker 版本过低导致,需要升级到 20.x 或更高版本以支持 V2 协议。
先检查 Docker 版本,版本过低则升级;版本正常则验证镜像信息是否正确。
使用 docker tag 命令为镜像打上新标签,去掉域名前缀,使镜像名称更简洁。
探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式
通过 Docker 登录方式配置轩辕镜像加速服务,包含7个详细步骤
在 Linux 系统上配置轩辕镜像源,支持主流发行版
在 Docker Desktop 中配置轩辕镜像加速,适用于桌面系统
在 Docker Compose 中使用轩辕镜像加速,支持容器编排
在 k8s 中配置 containerd 使用轩辕镜像加速
在宝塔面板中配置轩辕镜像加速,提升服务器管理效率
在 Synology 群晖NAS系统中配置轩辕镜像加速
在飞牛fnOS系统中配置轩辕镜像加速
在极空间NAS中配置轩辕镜像加速
在爱快ikuai系统中配置轩辕镜像加速
在绿联NAS系统中配置轩辕镜像加速
在威联通NAS系统中配置轩辕镜像加速
在 Podman 中配置轩辕镜像加速,支持多系统
配置轩辕镜像加速9大主流镜像仓库,包含详细配置步骤
无需登录即可使用轩辕镜像加速服务,更加便捷高效
需要其他帮助?请查看我们的 常见问题 或 官方QQ群: 13763429