whisper-asr-webservice 是一个基于 OpenAI Whisper 语音识别模型构建的 Web 服务,提供便捷的 API 接口,支持多语言语音到文本的实时或批量转录,用户可根据需求选择 tiny、base、small、medium、large 等不同大小的模型,具备易于部署、高效准确的特点,适用于将语音识别功能快速集成到各类应用、服务或系统中。
收藏数: 95
下载次数: 1543220
类型:

onerahmet/openai-whisper-asr-webservice!Release !Docker Pulls !Build !Licence
Whisper ASR Box 是一款通用语音识别工具包。其模型基于大规模多样化音频数据集训练,支持多语言语音识别、语音翻译及语言识别等多任务处理。
当前 v1.8.2 版本支持以下语音识别模型:
通过 Docker 启动 CPU 服务:
shelldocker run -d -p 9000:9000 \ -e ASR_MODEL=base \ -e ASR_ENGINE=openai_whisper \ onerahmet/openai-whisper-asr-webservice:latest
需确保已安装 NVIDIA Docker 支持,启动命令:
shelldocker run -d --gpus all -p 9000:9000 \ -e ASR_MODEL=base \ -e ASR_ENGINE=openai_whisper \ onerahmet/openai-whisper-asr-webservice:latest-gpu
为避免重复下载模型、缩短启动时间,可持久化缓存目录:
shelldocker run -d -p 9000:9000 \ -v $PWD/cache:/root/.cache/ \ onerahmet/openai-whisper-asr-webservice:latest
关键参数说明:
ASR_ENGINE:引擎选择(openai_whisper / faster_whisper / whisperx)ASR_MODEL:模型规格(tiny / base / small / medium / large-v3 等)ASR_MODEL_PATH:自定义模型存储/加载路径ASR_DEVICE:运行设备(cuda / cpu)MODEL_IDLE_TIMEOUT:模型闲置卸载超时时间详细使用说明及配置项参见:
[***]
shellpip3 install poetry
shellpoetry install
shellpoetry run whisper-asr-webservice --host 0.0.0.0 --port 9000
服务启动后,访问 [***] 或 [***] 可打开 Swagger UI,测试 API 接口。
本软件使用 FFmpeg 项目的库,遵循 LGPLv2.1 许可证。
以下是 onerahmet/openai-whisper-asr-webservice 相关的常用 Docker 镜像,适用于 不同场景 等不同场景:
您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 版本下载页面。



manifest unknown 错误
TLS 证书验证失败
DNS 解析超时
410 错误:版本过低
402 错误:流量耗尽
身份认证失败错误
429 限流错误
凭证保存错误
来自真实用户的反馈,见证轩辕镜像的优质服务