蒙特利尔强制对齐器(Montreal Forced Aligner)的官方Docker镜像,用于音频与文本的强制对齐,生成音素级时间标记,支持多语言语音处理与语音数据预处理。
收藏数: 5
下载次数: 8879
类型:

mmcauliffe/montreal-forced-aligner本镜像为蒙特利尔强制对齐器(Montreal Forced Aligner,简称MFA)的官方Docker化部署方案,旨在简化MFA的环境配置与跨平台运行。MFA是一款开源语音处理工具,核心功能为将音频文件与文本转录本进行强制对齐,生成音素级别的时间标记,广泛应用于语音识别、语音合成、语言学研究等领域。
bashdocker pull montrealcorpustools/montreal-forced-aligner:latest
将本地数据目录(如./mfa_data)挂载至容器内/data目录,执行对齐任务:
bashdocker run -it --rm \ -v $(pwd)/mfa_data:/data \ montrealcorpustools/montreal-forced-aligner \ mfa align \ /data/audio_dir \ # 容器内音频文件目录(对应本地./mfa_data/audio_dir) /data/transcripts.txt \ # 容器内文本转录本文件(对应本地./mfa_data/transcripts.txt) /data/output_dir \ # 容器内输出目录(对应本地./mfa_data/output_dir) english # 使用的预训练语言模型(可替换为"chinese"、"french"等)
| 参数/路径 | 说明 |
|---|---|
-v $(pwd)/mfa_data:/data | 本地数据目录与容器内/data目录挂载,实现数据共享 |
mfa align | MFA核心对齐命令 |
audio_dir | 音频文件存放目录,支持子目录递归查找 |
transcripts.txt | 文本转录本文件,格式要求:每行格式为文件名 转录文本(文件名不含扩展名) |
output_dir | 对齐结果输出目录,默认生成TextGrid格式标注文件 |
english | 预训练语言模型名称,完整支持列表见MFA官方文档 |
若需使用自定义声学模型或词典,可通过额外挂载模型目录实现:
bashdocker run -it --rm \ -v $(pwd)/mfa_data:/data \ -v $(pwd)/custom_models:/models \ # 挂载本地自定义模型目录 montrealcorpustools/montreal-forced-aligner \ mfa align \ /data/audio_dir \ /data/transcripts.txt \ /data/output_dir \ /models/custom_language_model # 指定自定义模型路径
对齐成功后,output_dir目录下将生成与音频文件同名的TextGrid格式标注文件,包含以下层级标注:
--memory=8g),避免内存溢出您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 版本下载页面。
manifest unknown 错误
TLS 证书验证失败
DNS 解析超时
410 错误:版本过低
402 错误:流量耗尽
身份认证失败错误
429 限流错误
凭证保存错误
来自真实用户的反馈,见证轩辕镜像的优质服务