专属域名
文档搜索
提交工单
轩辕助手
Run助手
返回顶部
快速返回页面顶部
收起
收起工具栏

fishaudio/fish-speech Docker 镜像 - 轩辕镜像

镜像简介

Fish Speech官方容器镜像,用于部署和运行Fish Speech语音处理相关应用,提供官方支持的标准化运行环境。

镜像统计信息

收藏数: 11

下载次数: 55822

状态: active

发布者: fishaudio

类型: 镜像

fish-speech
fishaudio/fish-speech
Fish Speech官方容器镜像,用于部署和运行Fish Speech语音处理相关应用,提供官方支持的标准化运行环境。
11 收藏0 次下载activefishaudio镜像
🚀轩辕镜像专业版更稳定💎一键安装 Docker 配置镜像源
版本下载
🚀轩辕镜像专业版更稳定💎一键安装 Docker 配置镜像源

Fish Speech Docker 镜像文档

镜像概述和主要用途

Fish Speech(现更名为OpenAudio)是一个开源的多语言文本转语音(TTS)工具,支持语音克隆功能。该Docker镜像提供了便捷的部署方式,让用户能够快速体验和集成高质量的文本转语音技术。OpenAudio系列模型在TTS-Arena2基准测试中排名第一,具备卓越的语音合成质量和多语言支持能力。

核心功能和特性

卓越的TTS质量

OpenAudio S1模型在Seed TTS评估指标中表现优异,在英文文本上实现了0.008 WER(词错误率)和0.004 CER(字符错误率),显著优于先前模型。

模型词错误率 (WER)字符错误率 (CER)说话人相似度
S10.0080.0040.332
S1-mini0.0110.0050.380
语音控制能力

支持多种情感、语调和特殊标记来增强语音合成:

  • 基本情感:(angry) (sad) (excited) (surprised) (satisfied) 等
  • 高级情感:(disdainful) (unhappy) (anxious) (hysterical) 等
  • 语调标记:(in a hurry tone) (shouting) (whispering) (soft tone) 等
  • 特殊音频效果:(laughing) (sobbing) (sighing) (panting) 等
核心功能
  1. 零样本和少样本TTS:仅需10-30秒的语音样本即可生成高质量TTS输出
  2. 多语言和跨语言支持:支持英语、日语、韩语、中文、法语、德语、阿拉伯语和西班牙语
  3. 无需音素依赖:模型具有很强的泛化能力,可处理任何语言脚本的文本
  4. 高精度:实现约0.4%的CER和0.8%的WER
  5. 快速性能:通过torch编译加速,在Nvidia RTX 4090 GPU上实时因子约为1:7
  6. WebUI界面:基于Gradio的易用Web界面,兼容主流浏览器
  7. GUI界面:提供PyQt6图形界面,支持Linux、Windows和macOS
两种模型类型
模型大小可用性特点
S14B参数fish.audio全功能旗舰模型
S1-mini0.5B参数Hugging Face精简版,保留核心功能

使用场景和适用范围

  • 文本转语音应用开发
  • 语音助手和虚拟人语音生成
  • 有声内容创作和音频书籍制作
  • 多语言语音合成需求
  • 语音克隆和个性化语音生成
  • 教育、无障碍和辅助技术应用

快速开始

前提条件
  • Docker Engine 20.10+
  • 对于GPU加速:
    • NVIDIA GPU with CUDA support
    • NVIDIA Container Toolkit
基本使用 (Web UI)
bash
docker run -p 7860:7860 --name fish-speech fishaudio/fish-speech

访问 http://localhost:7860 即可使用Web界面。

GPU加速
bash
docker run --gpus all -p 7860:7860 --name fish-speech fishaudio/fish-speech
后台运行
bash
docker run -d --gpus all -p 7860:7860 --name fish-speech fishaudio/fish-speech

高级配置

Docker Compose 部署

创建 docker-compose.yml 文件:

yaml
version: '3.8'

services:
  fish-speech:
    image: fishaudio/fish-speech
    container_name: fish-speech
    restart: unless-stopped
    ports:
      - "7860:7860"  # Web UI端口
      - "5000:5000"  # API端口
    volumes:
      - ./data:/app/data  # 数据持久化
      - ./models:/app/models  # 模型文件
    environment:
      - MODEL_TYPE=s1-mini  # 模型类型: s1 或 s1-mini
      - ENABLE_API=true     # 启用API服务
      - CORS_ALLOWED_ORIGINS=*  # CORS设置
    deploy:
      resources:
        reservations:
          devices:
            - driver: nvidia
              count: 1
              capabilities: [gpu]

启动服务:

bash
docker-compose up -d
环境变量配置
环境变量说明默认值可选值
MODEL_TYPE模型类型选择s1-minis1, s1-mini
ENABLE_WEBUI是否启用Web UItruetrue, false
ENABLE_API是否启用API服务falsetrue, false
WEBUI_PORTWeb UI端口78601-65535
API_PORTAPI服务端口50001-65535
CORS_ALLOWED_ORIGINSCORS允许的源*具体域名或*
LOG_LEVEL日志级别infodebug, info, warning, error
MAX_BATCH_SIZE最大批处理大小4正整数
CACHE_DIR缓存目录/app/cache容器内路径
模型持久化

为避免每次启动重新下载模型,可以将模型目录挂载到宿主机:

bash
docker run --gpus all -p 7860:7860 \
  -v ./fish-speech-models:/app/models \
  --name fish-speech fishaudio/fish-speech
API 使用示例

启用API后,可以通过HTTP请求调用TTS服务:

bash
curl -X POST http://localhost:5000/tts \
  -H "Content-Type: application/json" \
  -d '{
    "text": "你好,这是Fish Speech的API示例。",
    "speaker_id": 0,
    "emotion": "neutral",
    "speed": 1.0,
    "pitch": 0.0
  }' --output output.wav

许可证信息

  • 代码库采用 Apache License 许可
  • 所有模型权重采用 CC-BY-NC-SA-4.0 License 许可

声明:我们不对代码库的任何非法使用承担责任。请参考当地关于DMCA和其他相关的规定。

相关资源

  • 官方网站
  • GitHub 仓库
  • 模型下载
  • 技术报告
  • 文档中心

引用

bibtex
@misc{fish-speech-v1.4,
      title={Fish-Speech: Leveraging Large Language Models for Advanced Multilingual Text-to-Speech Synthesis},
      author={Shijia Liao and Yuxuan Wang and Tianyu Li and Yifan Cheng and Ruoyi Zhang and Rongzhi Zhou and Yijin Xing},
      year={2024},
      eprint={2411.01156},
      archivePrefix={arXiv},
      primaryClass={cs.SD},
      url={[***]},
}

相关 Docker 镜像推荐

以下是 fishaudio/fish-speech 相关的常用 Docker 镜像,适用于 不同场景 等不同场景:

  • guiji2025/fish-speech-ziming Docker 镜像说明(语音合成工具,支持中文语音生成)

镜像拉取方式

您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 版本下载页面。

国内拉取方式

docker pull docker.xuanyuan.run/fishaudio/fish-speech:<标签>

使用方法:

  • 登录认证方式
  • 免认证方式

官方拉取方式

docker pull fishaudio/fish-speech:<标签>

相关镜像推荐

glassfish logo
glassfish
by library
官方
已弃用;该镜像已被原维护者放弃,即将从官方仓库移除,建议用户尽快迁移至替代方案(如DockerHub上的`glassfish/server`)。
1581M+ pulls
上次更新:9 年前
atlassian/fisheye logo
atlassian/fisheye
by Atlassian
认证
Fisheye:跨SVN、Git和Perforce仓库进行搜索、监控和跟踪。
9500K+ pulls
上次更新:4 天前
islandora/crayfish logo
islandora/crayfish
by islandora
Crayfish服务(如Houdini、Hypercube等)的基础镜像
10K+ pulls
上次更新:8 天前
airbyte/source-fish logo
airbyte/source-fish
by Airbyte
认证
暂无描述
288 pulls
上次更新:10 个月前
查看更多 fish-speech 相关镜像

轩辕镜像配置手册

探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式

登录仓库拉取

通过 Docker 登录认证访问私有仓库

Linux

在 Linux 系统配置镜像服务

Windows/Mac

在 Docker Desktop 配置镜像

Docker Compose

Docker Compose 项目配置

K8s Containerd

Kubernetes 集群配置 Containerd

K3s

K3s 轻量级 Kubernetes 镜像加速

宝塔面板

在宝塔面板一键配置镜像

群晖

Synology 群晖 NAS 配置

飞牛

飞牛 fnOS 系统配置镜像

极空间

极空间 NAS 系统配置服务

爱快路由

爱快 iKuai 路由系统配置

绿联

绿联 NAS 系统配置镜像

威联通

QNAP 威联通 NAS 配置

Podman

Podman 容器引擎配置

Singularity/Apptainer

HPC 科学计算容器配置

其他仓库配置

ghcr、Quay、nvcr 等镜像仓库

专属域名拉取

无需登录使用专属域名

需要其他帮助?请查看我们的 常见问题Docker 镜像访问常见问题解答 或 提交工单

镜像拉取常见问题

轩辕镜像免费版与专业版有什么区别?

免费版仅支持 Docker Hub 访问,不承诺可用性和速度;专业版支持更多镜像源,保证可用性和稳定速度,提供优先客服响应。

轩辕镜像支持哪些镜像仓库?

专业版支持 docker.io、gcr.io、ghcr.io、registry.k8s.io、nvcr.io、quay.io、mcr.microsoft.com、docker.elastic.co 等;免费版仅支持 docker.io。

流量耗尽错误提示

当返回 402 Payment Required 错误时,表示流量已耗尽,需要充值流量包以恢复服务。

410 错误问题

通常由 Docker 版本过低导致,需要升级到 20.x 或更高版本以支持 V2 协议。

manifest unknown 错误

先检查 Docker 版本,版本过低则升级;版本正常则验证镜像信息是否正确。

镜像拉取成功后,如何去掉轩辕镜像域名前缀?

使用 docker tag 命令为镜像打上新标签,去掉域名前缀,使镜像名称更简洁。

查看全部问题→

用户好评

来自真实用户的反馈,见证轩辕镜像的优质服务

oldzhang的头像

oldzhang

运维工程师

Linux服务器

5

"Docker访问体验非常流畅,大镜像也能快速完成下载。"

轩辕镜像
镜像详情
...
fishaudio/fish-speech
官方博客Docker 镜像使用技巧与技术博客
热门镜像查看热门 Docker 镜像推荐
提交工单
免费获取在线技术支持请 提交工单,官方QQ群:13763429 。
轩辕镜像面向开发者与科研用户,提供开源镜像的搜索和访问支持。所有镜像均来源于原始仓库,本站不存储、不修改、不传播任何镜像内容。
免费获取在线技术支持请提交工单,官方QQ群: 。
轩辕镜像面向开发者与科研用户,提供开源镜像的搜索和访问支持。所有镜像均来源于原始仓库,本站不存储、不修改、不传播任何镜像内容。
商务:17300950906
©2024-2026 源码跳动
商务合作电话:17300950906Copyright © 2024-2025 杭州源码跳动科技有限公司. All rights reserved.
轩辕镜像 官方专业版 Logo
轩辕镜像官方专业版
首页个人中心搜索镜像
交易
充值流量我的订单
工具
提交工单镜像收录一键安装
Npm 源Pip 源Homebrew 源
帮助
常见问题
其他
关于我们网站地图

官方QQ群: 13763429