
breakstring/gpt-sovits本Docker镜像封装了GPT-SoVITS-WebUI项目,这是一个功能强大的少样本语音转换和文本转语音(TTS)工具。通过WebUI界面,用户可轻松实现零样本TTS(仅需5秒语音样本)、少样本TTS(1分钟数据微调)及跨语言语音合成,支持中文、英文和日文。镜像集成了语音分离、数据集分割、语音识别等辅助工具,降低了语音模型训练和推理的技术门槛。
由于项目迭代较快,建议先访问Docker Hub查看最新镜像标签,选择适合的版本。
yamlversion: '3' services: gpt-sovits: image: breakstring/gpt-sovits:latest # 替换为实际标签 restart: always environment: - is_half=False # 控制半精度/双精度,SSL提取阶段异常时可调整 volumes: - ./output:/workspace/output # 输出目录 - ./logs:/workspace/logs # 日志目录 - ./SoVITS_weights:/workspace/SoVITS_weights # 模型权重目录 - ./GPT_SoVITS/pretrained_models:/workspace/GPT_SoVITS/pretrained_models # 预训练模型目录 ports: - "9870:9870" - "9871:9871" - "9872:9872" - "9873:9873" - "9874:9874" shm_size: "16G" # Windows Docker Desktop需调大共享内存,避免运行异常 deploy: resources: reservations: devices: - driver: nvidia count: all capabilities: [gpu] # GPU配置,根据实际环境调整
bashdocker compose -f "docker-compose.yaml" up -d
根据实际需求调整参数后执行:
bashdocker run --rm -it \ --gpus=all \ --env=is_half=False \ --volume=/path/to/output:/workspace/output \ --volume=/path/to/logs:/workspace/logs \ --volume=/path/to/SoVITS_weights:/workspace/SoVITS_weights \ --volume=/path/to/pretrained_models:/workspace/GPT_SoVITS/pretrained_models \ --workdir=/workspace \ -p 9870:9870 -p 9871:9871 -p 9872:9872 -p 9873:9873 -p 9874:9874 \ --shm_size="16G" \ -d breakstring/gpt-sovits:latest # 替换为实际标签
is_half:控制模型精度模式(半精度/双精度),若SSL提取阶段(4-cnhubert/5-wav32k目录无内容生成)异常,可尝试切换True或False/workspace/output:输出文件目录(生成的语音等)/workspace/logs:日志文件目录/workspace/SoVITS_weights:SoVITS模型权重目录/workspace/GPT_SoVITS/pretrained_models:预训练模型存放目录(需从GPT-SoVITS Models下载)默认开放端口9870-9874,用于WebUI访问及服务通信
--shm_size:建议设置为16G及以上,特别是Windows环境下避免共享内存不足--gpus=all启用所有GPU,或根据需求指定GPU设备容器启动后,通过浏览器访问http://localhost:9870即可打开GPT-SoVITS-WebUI界面。
GPT_SoVITS/pretrained_models目录tools/uvr5/uvr5_weights目录manifest unknown 错误
TLS 证书验证失败
DNS 解析超时
410 错误:版本过低
402 错误:流量耗尽
身份认证失败错误
429 限流错误
凭证保存错误
来自真实用户的反馈,见证轩辕镜像的优质服务