专属域名
文档搜索
轩辕助手
Run助手
邀请有礼
返回顶部
快速返回页面顶部
收起
收起工具栏
轩辕镜像 官方专业版
轩辕镜像 官方专业版轩辕镜像 官方专业版官方专业版
首页个人中心搜索镜像

交易
充值流量我的订单
工具
提交工单镜像收录一键安装
Npm 源Pip 源Homebrew 源
帮助
常见问题
其他
关于我们网站地图

官方QQ群: 1072982923

fishaudio/fish-speech Docker 镜像 - 轩辕镜像 | Docker 镜像高效稳定拉取服务

镜像简介

Fish Speech官方容器镜像,用于部署和运行Fish Speech语音处理相关应用,提供官方支持的标准化运行环境。

镜像统计信息

收藏数: 12

下载次数: 61413

类型:

fish-speech
fishaudio/fish-speech
fishaudio
Fish Speech官方容器镜像,用于部署和运行Fish Speech语音处理相关应用,提供官方支持的标准化运行环境。
12 次收藏下载次数: 0状态:社区镜像维护者:fishaudio仓库类型:镜像
💣 CI/CD 卡在拉镜像?问题不在代码,在镜像源
版本下载
💣 CI/CD 卡在拉镜像?问题不在代码,在镜像源

Fish Speech Docker 镜像文档

镜像概述和主要用途

Fish Speech(现更名为OpenAudio)是一个开源的多语言文本转语音(TTS)工具,支持语音克隆功能。该Docker镜像提供了便捷的部署方式,让用户能够快速体验和集成高质量的文本转语音技术。OpenAudio系列模型在TTS-Arena2基准测试中排名第一,具备卓越的语音合成质量和多语言支持能力。

核心功能和特性

卓越的TTS质量

OpenAudio S1模型在Seed TTS评估指标中表现优异,在英文文本上实现了0.008 WER(词错误率)和0.004 CER(字符错误率),显著优于先前模型。

模型词错误率 (WER)字符错误率 (CER)说话人相似度
S10.0080.0040.332
S1-mini0.0110.0050.380
语音控制能力

支持多种情感、语调和特殊标记来增强语音合成:

  • 基本情感:(angry) (sad) (excited) (surprised) (satisfied) 等
  • 高级情感:(disdainful) (unhappy) (anxious) (hysterical) 等
  • 语调标记:(in a hurry tone) (shouting) (whispering) (soft tone) 等
  • 特殊音频效果:(laughing) (sobbing) (sighing) (panting) 等
核心功能
  1. 零样本和少样本TTS:仅需10-30秒的语音样本即可生成高质量TTS输出
  2. 多语言和跨语言支持:支持英语、日语、韩语、中文、法语、德语、阿拉伯语和西班牙语
  3. 无需音素依赖:模型具有很强的泛化能力,可处理任何语言脚本的文本
  4. 高精度:实现约0.4%的CER和0.8%的WER
  5. 快速性能:通过torch编译加速,在Nvidia RTX 4090 GPU上实时因子约为1:7
  6. WebUI界面:基于Gradio的易用Web界面,兼容主流浏览器
  7. GUI界面:提供PyQt6图形界面,支持Linux、Windows和macOS
两种模型类型
模型大小可用性特点
S14B参数fish.audio全功能旗舰模型
S1-mini0.5B参数Hugging Face精简版,保留核心功能

使用场景和适用范围

  • 文本转语音应用开发
  • 语音助手和虚拟人语音生成
  • 有声内容创作和音频书籍制作
  • 多语言语音合成需求
  • 语音克隆和个性化语音生成
  • 教育、无障碍和辅助技术应用

快速开始

前提条件
  • Docker Engine 20.10+
  • 对于GPU加速:
    • NVIDIA GPU with CUDA support
    • NVIDIA Container Toolkit
基本使用 (Web UI)
bash
docker run -p 7860:7860 --name fish-speech fishaudio/fish-speech

访问 http://localhost:7860 即可使用Web界面。

GPU加速
bash
docker run --gpus all -p 7860:7860 --name fish-speech fishaudio/fish-speech
后台运行
bash
docker run -d --gpus all -p 7860:7860 --name fish-speech fishaudio/fish-speech

高级配置

Docker Compose 部署

创建 docker-compose.yml 文件:

yaml
version: '3.8'

services:
  fish-speech:
    image: fishaudio/fish-speech
    container_name: fish-speech
    restart: unless-stopped
    ports:
      - "7860:7860"  # Web UI端口
      - "5000:5000"  # API端口
    volumes:
      - ./data:/app/data  # 数据持久化
      - ./models:/app/models  # 模型文件
    environment:
      - MODEL_TYPE=s1-mini  # 模型类型: s1 或 s1-mini
      - ENABLE_API=true     # 启用API服务
      - CORS_ALLOWED_ORIGINS=*  # CORS设置
    deploy:
      resources:
        reservations:
          devices:
            - driver: nvidia
              count: 1
              capabilities: [gpu]

启动服务:

bash
docker-compose up -d
环境变量配置
环境变量说明默认值可选值
MODEL_TYPE模型类型选择s1-minis1, s1-mini
ENABLE_WEBUI是否启用Web UItruetrue, false
ENABLE_API是否启用API服务falsetrue, false
WEBUI_PORTWeb UI端口78601-65535
API_PORTAPI服务端口50001-65535
CORS_ALLOWED_ORIGINSCORS允许的源*具体域名或*
LOG_LEVEL日志级别infodebug, info, warning, error
MAX_BATCH_SIZE最大批处理大小4正整数
CACHE_DIR缓存目录/app/cache容器内路径
模型持久化

为避免每次启动重新下载模型,可以将模型目录挂载到宿主机:

bash
docker run --gpus all -p 7860:7860 \
  -v ./fish-speech-models:/app/models \
  --name fish-speech fishaudio/fish-speech
API 使用示例

启用API后,可以通过HTTP请求调用TTS服务:

bash
curl -X POST http://localhost:5000/tts \
  -H "Content-Type: application/json" \
  -d '{
    "text": "你好,这是Fish Speech的API示例。",
    "speaker_id": 0,
    "emotion": "neutral",
    "speed": 1.0,
    "pitch": 0.0
  }' --output output.wav

许可证信息

  • 代码库采用 Apache License 许可
  • 所有模型权重采用 CC-BY-NC-SA-4.0 License 许可

声明:我们不对代码库的任何非法使用承担责任。请参考当地关于DMCA和其他相关的规定。

相关资源

  • 官方网站
  • GitHub 仓库
  • 模型下载
  • 技术报告
  • 文档中心

引用

bibtex
@misc{fish-speech-v1.4,
      title={Fish-Speech: Leveraging Large Language Models for Advanced Multilingual Text-to-Speech Synthesis},
      author={Shijia Liao and Yuxuan Wang and Tianyu Li and Yifan Cheng and Ruoyi Zhang and Rongzhi Zhou and Yijin Xing},
      year={2024},
      eprint={2411.01156},
      archivePrefix={arXiv},
      primaryClass={cs.SD},
      url={[***]},
}

相关 Docker 镜像推荐

以下是 fishaudio/fish-speech 相关的常用 Docker 镜像,适用于 不同场景 等不同场景:

  • guiji2025/fish-speech-ziming Docker 镜像说明(语音合成工具,支持中文语音生成)

镜像拉取方式

您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 版本下载页面。

国内拉取方式

docker pull docker.xuanyuan.run/fishaudio/fish-speech:<标签>

使用方法:

  • 登录认证方式
  • 免认证方式

官方拉取方式

docker pull fishaudio/fish-speech:<标签>

相关镜像推荐

glassfish logo
glassfish
Docker 官方镜像
已弃用;该镜像已被原维护者放弃,即将从官方仓库移除,建议用户尽快迁移至替代方案(如DockerHub上的`glassfish/server`)。
159 次收藏100万+ 次下载
9 年前更新
atlassian/fisheye logo
atlassian/fisheye
atlassian
Fisheye:跨SVN、Git和Perforce仓库进行搜索、监控和跟踪。
9 次收藏50万+ 次下载
23 天前更新
islandora/crayfish logo
islandora/crayfish
islandora
Crayfish服务(如Houdini、Hypercube等)的基础镜像
5万+ 次下载
18 天前更新
airbyte/source-fish logo
airbyte/source-fish
airbyte
暂无描述
298 次下载
12 个月前更新
查看更多 fish-speech 相关镜像

轩辕镜像配置手册

探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式

Docker 配置

登录仓库拉取

通过 Docker 登录认证访问私有仓库

专属域名拉取

无需登录使用专属域名

K8s Containerd

Kubernetes 集群配置 Containerd

K3s

K3s 轻量级 Kubernetes 镜像加速

Dev Containers

VS Code Dev Containers 配置

Podman

Podman 容器引擎配置

Singularity/Apptainer

HPC 科学计算容器配置

其他仓库配置

ghcr、Quay、nvcr 等镜像仓库

系统配置

Linux

在 Linux 系统配置镜像服务

Windows/Mac

在 Docker Desktop 配置镜像

MacOS OrbStack

MacOS OrbStack 容器配置

Docker Compose

Docker Compose 项目配置

NAS 设备

群晖

Synology 群晖 NAS 配置

飞牛

飞牛 fnOS 系统配置镜像

绿联

绿联 NAS 系统配置镜像

威联通

QNAP 威联通 NAS 配置

极空间

极空间 NAS 系统配置服务

网络设备

爱快路由

爱快 iKuai 路由系统配置

宝塔面板

在宝塔面板一键配置镜像

需要其他帮助?请查看我们的 常见问题Docker 镜像访问常见问题解答 或 提交工单

镜像拉取常见问题

使用与功能问题

docker search 报错:专属域名下仅支持 Docker Hub 查询

docker search 报错问题

网页搜不到镜像:Docker Hub 有但轩辕镜像搜索无结果

镜像搜索不到

离线传输镜像:无法直连时用 docker save/load 迁移

离线传输镜像

Docker 插件安装错误:application/vnd.docker.plugin.v1+json

Docker 插件安装错误

WSL 下 Docker 拉取慢:网络与挂载目录影响及优化

WSL 拉取镜像慢

轩辕镜像是否安全?镜像完整性校验(digest)说明

镜像安全性

如何用轩辕镜像拉取镜像?登录方式与专属域名配置

如何拉取镜像

错误码与失败问题

manifest unknown 错误:镜像不存在或标签错误

manifest unknown 错误

TLS/SSL 证书验证失败:Docker pull 时 HTTPS 证书错误

TLS 证书验证失败

DNS 解析超时:无法解析镜像仓库地址或连接超时

DNS 解析超时

410 Gone 错误:Docker 版本过低导致协议不兼容

410 错误:版本过低

402 Payment Required 错误:流量耗尽错误提示

402 错误:流量耗尽

401 UNAUTHORIZED 错误:身份认证失败或登录信息错误

身份认证失败错误

429 Too Many Requests 错误:请求频率超出专业版限制

429 限流错误

Docker login 凭证保存错误:Cannot autolaunch D-Bus(不影响登录)

凭证保存错误

账号 / 计费 / 权限

免费版与专业版区别:功能、限额与使用场景对比

免费版与专业版区别

支持的镜像仓库:Docker Hub、GCR、GHCR、K8s 等列表

轩辕镜像支持的镜像仓库

拉取失败是否扣流量?计费规则说明

拉取失败流量计费

KYSEC 权限不够:麒麟 V10/统信 UOS 下脚本执行被拦截

KYSEC 权限错误

如何申请开具发票?(增值税普票/专票)

开具发票

如何修改网站与仓库登录密码?

修改网站和仓库密码

配置与原理类

registry-mirrors 未生效:仍访问官方仓库或报错的原因

registry-mirrors 未生效

如何去掉镜像名称中的轩辕域名前缀?(docker tag)

去掉域名前缀

如何拉取指定架构镜像?(ARM64/AMD64 等多架构)

拉取指定架构镜像

查看全部问题→

用户好评

来自真实用户的反馈,见证轩辕镜像的优质服务

用户头像

oldzhang

运维工程师

Linux服务器

5

"Docker访问体验非常流畅,大镜像也能快速完成下载。"

轩辕镜像
镜像详情
...
fishaudio/fish-speech
官方博客Docker 镜像使用技巧与技术博客
热门镜像查看热门 Docker 镜像推荐
一键安装一键安装 Docker 并配置镜像源
镜像拉取问题咨询请 提交工单,官方技术交流群:1072982923
轩辕镜像面向开发者与科研用户,提供开源镜像的搜索和访问支持。所有镜像均来源于原始仓库,本站不存储、不修改、不传播任何镜像内容。
镜像拉取问题咨询请提交工单,官方技术交流群:
轩辕镜像面向开发者与科研用户,提供开源镜像的搜索和访问支持。所有镜像均来源于原始仓库,本站不存储、不修改、不传播任何镜像内容。
官方邮箱:点击复制邮箱
©2024-2026 源码跳动
官方邮箱:点击复制邮箱Copyright © 2024-2026 杭州源码跳动科技有限公司. All rights reserved.