
本Docker镜像封装了GPT-SoVITS-WebUI项目,这是一个功能强大的少样本语音转换和文本转语音(TTS)工具。通过WebUI界面,用户可轻松实现零样本TTS(仅需5秒语音样本)、少样本TTS(1分钟数据微调)及跨语言语音合成,支持中文、英文和日文。镜像集成了语音分离、数据集分割、语音识别等辅助工具,降低了语音模型训练和推理的技术门槛。
镜像标签选择
由于项目迭代较快,建议先访问https://hub.docker.com/r/breakstring/gpt-sovits%E6%9F%A5%E7%9C%8B%E6%9C%80%E6%96%B0%E9%95%9C%E5%83%8F%E6%A0%87%E7%AD%BE%EF%BC%8C%E9%80%89%E6%8B%A9%E9%80%82%E5%90%88%E7%9A%84%E7%89%88%E6%9C%AC%E3%80%82
docker-compose.yaml配置示例
yamlversion: '3' services: gpt-sovits: image: breakstring/gpt-sovits:latest # 替换为实际标签 restart: always environment: - is_half=False # 控制半精度/双精度,SSL提取阶段异常时可调整 volumes: - ./output:/workspace/output # 输出目录 - ./logs:/workspace/logs # 日志目录 - ./SoVITS_weights:/workspace/SoVITS_weights # 模型权重目录 - ./GPT_SoVITS/pretrained_models:/workspace/GPT_SoVITS/pretrained_models # 预训练模型目录 ports: - "9870:9870" - "9871:9871" - "9872:9872" - "9873:9873" - "9874:9874" shm_size: "16G" # Windows Docker Desktop需调大共享内存,避免运行异常 deploy: resources: reservations: devices: - driver: nvidia count: all capabilities: [gpu] # GPU配置,根据实际环境调整
启动命令
bashdocker compose -f "docker-compose.yaml" up -d
根据实际需求调整参数后执行:
bashdocker run --rm -it \ --gpus=all \ --env=is_half=False \ --volume=/path/to/output:/workspace/output \ --volume=/path/to/logs:/workspace/logs \ --volume=/path/to/SoVITS_weights:/workspace/SoVITS_weights \ --volume=/path/to/pretrained_models:/workspace/GPT_SoVITS/pretrained_models \ --workdir=/workspace \ -p 9870:9870 -p 9871:9871 -p 9872:9872 -p 9873:9873 -p 9874:9874 \ --shm_size="16G" \ -d breakstring/gpt-sovits:latest # 替换为实际标签
环境变量
is_half:控制模型精度模式(半精度/双精度),若SSL提取阶段(4-cnhubert/5-wav32k目录无内容生成)异常,可尝试切换True或False卷挂载
/workspace/output:输出文件目录(生成的语音等)/workspace/logs:日志文件目录/workspace/SoVITS_weights:SoVITS模型权重目录/workspace/GPT_SoVITS/pretrained_models:预训练模型存放目录(需从GPT-SoVITS Models下载)端口映射
默认开放端口9870-9874,用于WebUI访问及服务通信
资源配置
--shm_size:建议设置为16G及以上,特别是Windows环境下避免共享内存不足--gpus=all启用所有GPU,或根据需求指定GPU设备容器启动后,通过浏览器访问http://localhost:9870即可打开GPT-SoVITS-WebUI界面。
GPT_SoVITS/pretrained_models目录tools/uvr5/uvr5_weights目录您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 标签列表页面。
探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式
通过 Docker 登录认证访问私有仓库
无需登录使用专属域名
Kubernetes 集群配置 Containerd
K3s 轻量级 Kubernetes 镜像加速
VS Code Dev Containers 配置
Podman 容器引擎配置
HPC 科学计算容器配置
ghcr、Quay、nvcr 等镜像仓库
Harbor Proxy Repository 对接专属域名
Portainer Registries 加速拉取
Nexus3 Docker Proxy 内网缓存
需要其他帮助?请查看我们的 常见问题Docker 镜像访问常见问题解答 或 提交工单
docker search 限制
站内搜不到镜像
离线 save/load
插件要用 plugin install
WSL 拉取慢
安全与 digest
新手拉取配置
镜像合规机制
manifest unknown
no matching manifest(架构)
invalid tar header(解压)
TLS 证书失败
DNS 超时
域名连通性排查
410 Gone 排查
402 与流量用尽
401 认证失败
429 限流
D-Bus 凭证提示
413 与超大单层
来自真实用户的反馈,见证轩辕镜像的优质服务