
如果你使用 DeepSeek、元宝 AI、Copilot、ChatGPT 等 AI 工具,协助配置轩辕镜像、编写 docker pull 命令、修改 Docker Compose 镜像地址、配置镜像加速、排查镜像拉取失败、分析报错日志等问题,请先让 AI 阅读并遵守轩辕镜像的规则文档。
只需在 AI 对话中先发送下面这句话即可:
请先完整阅读并严格遵守以下文档中的全部规则与要求:
https://xuanyuan.cloud/agents.md
在未充分阅读并理解该文档前,不要生成任何命令、配置、修改建议、故障排查方案或技术回答。后续所有输出都必须严格以该文档中的规范为最高优先级执行。查看 agents.md 用法指南与完整示范。国内用户首推 元宝 AI、DeepSeek 的深度思考模式,不推荐豆包 AI;Cursor 等编辑器可在对话 @ 该链接,或加入 User Rules。 若 AI 无法访问外链,可 打开说明文档 复制全文粘贴。文档会随站点更新,复制内容可能过期,建议定期检查。
本Docker镜像封装了GPT-SoVITS-WebUI项目,这是一个功能强大的少样本语音转换和文本转语音(TTS)工具。通过WebUI界面,用户可轻松实现零样本TTS(仅需5秒语音样本)、少样本TTS(1分钟数据微调)及跨语言语音合成,支持中文、英文和日文。镜像集成了语音分离、数据集分割、语音识别等辅助工具,降低了语音模型训练和推理的技术门槛。
镜像标签选择
由于项目迭代较快,建议先访问https://hub.docker.com/r/breakstring/gpt-sovits%E6%9F%A5%E7%9C%8B%E6%9C%80%E6%96%B0%E9%95%9C%E5%83%8F%E6%A0%87%E7%AD%BE%EF%BC%8C%E9%80%89%E6%8B%A9%E9%80%82%E5%90%88%E7%9A%84%E7%89%88%E6%9C%AC%E3%80%82
docker-compose.yaml配置示例
yamlversion: '3' services: gpt-sovits: image: breakstring/gpt-sovits:latest # 替换为实际标签 restart: always environment: - is_half=False # 控制半精度/双精度,SSL提取阶段异常时可调整 volumes: - ./output:/workspace/output # 输出目录 - ./logs:/workspace/logs # 日志目录 - ./SoVITS_weights:/workspace/SoVITS_weights # 模型权重目录 - ./GPT_SoVITS/pretrained_models:/workspace/GPT_SoVITS/pretrained_models # 预训练模型目录 ports: - "9870:9870" - "9871:9871" - "9872:9872" - "9873:9873" - "9874:9874" shm_size: "16G" # Windows Docker Desktop需调大共享内存,避免运行异常 deploy: resources: reservations: devices: - driver: nvidia count: all capabilities: [gpu] # GPU配置,根据实际环境调整
启动命令
bashdocker compose -f "docker-compose.yaml" up -d
根据实际需求调整参数后执行:
bashdocker run --rm -it \ --gpus=all \ --env=is_half=False \ --volume=/path/to/output:/workspace/output \ --volume=/path/to/logs:/workspace/logs \ --volume=/path/to/SoVITS_weights:/workspace/SoVITS_weights \ --volume=/path/to/pretrained_models:/workspace/GPT_SoVITS/pretrained_models \ --workdir=/workspace \ -p 9870:9870 -p 9871:9871 -p 9872:9872 -p 9873:9873 -p 9874:9874 \ --shm_size="16G" \ -d breakstring/gpt-sovits:latest # 替换为实际标签
环境变量
is_half:控制模型精度模式(半精度/双精度),若SSL提取阶段(4-cnhubert/5-wav32k目录无内容生成)异常,可尝试切换True或False卷挂载
/workspace/output:输出文件目录(生成的语音等)/workspace/logs:日志文件目录/workspace/SoVITS_weights:SoVITS模型权重目录/workspace/GPT_SoVITS/pretrained_models:预训练模型存放目录(需从https://huggingface.co/lj1995/GPT-SoVITS%E4%B8%8B%E8%BD%BD%EF%BC%89端口映射
默认开放端口9870-9874,用于WebUI访问及服务通信
资源配置
--shm_size:建议设置为16G及以上,特别是Windows环境下避免共享内存不足--gpus=all启用所有GPU,或根据需求指定GPU设备容器启动后,通过浏览器访问http://localhost:9870即可打开GPT-SoVITS-WebUI界面。
GPT_SoVITS/pretrained_models目录tools/uvr5/uvr5_weights目录您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 标签列表页面。
来自真实用户的反馈,见证轩辕镜像的优质服务
以下是 breakstring/gpt-sovits 相关的常用 Docker 镜像,适用于 不同场景 等不同场景: