
如果你使用 DeepSeek、元宝 AI、Copilot、ChatGPT 等 AI 工具,协助配置轩辕镜像、编写 docker pull 命令、修改 Docker Compose 镜像地址、配置镜像加速、排查镜像拉取失败、分析报错日志等问题,请先让 AI 阅读并遵守轩辕镜像的规则文档。
只需在 AI 对话中先发送下面这句话即可:
请先完整阅读并严格遵守以下文档中的全部规则与要求:
https://xuanyuan.cloud/agents.md
在未充分阅读并理解该文档前,不要生成任何命令、配置、修改建议、故障排查方案或技术回答。后续所有输出都必须严格以该文档中的规范为最高优先级执行。查看 agents.md 用法指南与完整示范。国内用户首推 元宝 AI、DeepSeek 的深度思考模式,不推荐豆包 AI;Cursor 等编辑器可在对话 @ 该链接,或加入 User Rules。 若 AI 无法访问外链,可 打开说明文档 复制全文粘贴。文档会随站点更新,复制内容可能过期,建议定期检查。
本镜像基于 https://github.com/alumae/kaldi-gstreamer-server 构建,可快速部署自动语音识别(ASR)服务。它采用master-worker架构,允许用户在本地或远程搭建ASR服务器,并通过自定义Kaldi模型实现语音转文字功能。
从Docker Hub拉取
bashdocker pull jcsilva/docker-kaldi-gstreamer-server
本地构建
bashdocker build -t kaldi-gstreamer-server:1.0 https://github.com/jcsilva/docker-kaldi-gstreamer-server
1. 同一主机部署master和worker
假设Kaldi模型位于主机/media/kaldi_models目录:
bashdocker run -it -p 8080:80 -v /media/kaldi_models:/opt/models jcsilva/docker-kaldi-gstreamer-server:latest /bin/bash
进入容器后启动服务:
bash/opt/start.sh -y /opt/models/nnet2.yaml
服务启动后,ASR接口监听主机8080端口。停止服务执行:
bash/opt/stop.sh
2. 部署worker连接远程master
假设Kaldi模型位于主机/media/kaldi_models目录:
bashdocker run -it -v /media/kaldi_models:/opt/models jcsilva/docker-kaldi-gstreamer-server:latest /bin/bash
进入容器后启动worker并连接远程master:
bash/opt/start.sh -y /opt/models/nnet2.yaml -m master-server.com -p 8888
停止worker服务:
bash/opt/stop.sh
检查服务状态
使用WebSocket客户端(如https://github.com/hakobera/Simple-WebSocket-Client%EF%BC%89%E8%AE%BF%E9%97%AE%EF%BC%9A
ws://MASTER_SERVER/client/ws/status(本地服务为ws://localhost:8080/client/ws/status),成功返回:
RESPONSE: {"num_workers_available":1, "num_requests_processed":0}。
测试语音识别
bashpython client.py -u ws://localhost:8080/client/ws/speech -r 32000 /path/to/audio.wav
ws://MASTER_SERVER/client/ws/speech。以下是搭建英文ASR服务的步骤(需主机至少4GB RAM):
bashcd /media/kaldi_models wget https://phon.ioc.ee/~tanela/tedlium_nnet_ms_sp_online.tgz tar -zxvf tedlium_nnet_ms_sp_online.tgz
bashwget https://raw.githubusercontent.com/alumae/kaldi-gstreamer-server/master/sample_english_nnet2.yaml -P /media/kaldi_models
bashfind /media/kaldi_models/ -type f | xargs sed -i 's:test:/opt:g' sed -i 's:full-post-processor:#full-post-processor:g' /media/kaldi_models/sample_english_nnet2.yaml
bashdocker run -it -p 8080:80 -v /media/kaldi_models:/opt/models jcsilva/docker-kaldi-gstreamer-server:latest /bin/bash
bash/opt/start.sh -y /opt/models/sample_english_nnet2.yaml
bash# 下载客户端和测试音频 wget https://raw.githubusercontent.com/alumae/kaldi-gstreamer-server/master/kaldigstserver/client.py -P /tmp wget https://raw.githubusercontent.com/jcsilva/docker-kaldi-gstreamer-server/master/audio/1272-128104-0000.wav -P /tmp wget https://raw.githubusercontent.com/alumae/kaldi-gstreamer-server/master/test/data/bill_gates-TED.mp3 -P /tmp # 安装依赖 pip install --user ws4py==0.3.2 simplejson pyaudio # 运行识别 python /tmp/client.py -u ws://localhost:8080/client/ws/speech -r 32000 /tmp/1272-128104-0000.wav python /tmp/client.py -u ws://localhost:8080/client/ws/speech -r 8192 /tmp/bill_gates-TED.mp3
您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 标签列表页面。
来自真实用户的反馈,见证轩辕镜像的优质服务