
本镜像为蒙特利尔强制对齐器(Montreal Forced Aligner,简称MFA)的官方Docker化部署方案,旨在简化MFA的环境配置与跨平台运行。MFA是一款开源语音处理工具,核心功能为将音频文件与文本转录本进行强制对齐,生成音素级别的时间标记,广泛应用于语音识别、语音合成、语言学研究等领域。
bashdocker pull montrealcorpustools/montreal-forced-aligner:latest
将本地数据目录(如./mfa_data)挂载至容器内/data目录,执行对齐任务:
bashdocker run -it --rm \ -v $(pwd)/mfa_data:/data \ montrealcorpustools/montreal-forced-aligner \ mfa align \ /data/audio_dir \ # 容器内音频文件目录(对应本地./mfa_data/audio_dir) /data/transcripts.txt \ # 容器内文本转录本文件(对应本地./mfa_data/transcripts.txt) /data/output_dir \ # 容器内输出目录(对应本地./mfa_data/output_dir) english # 使用的预训练语言模型(可替换为"chinese"、"french"等)
| 参数/路径 | 说明 |
|---|---|
-v $(pwd)/mfa_data:/data | 本地数据目录与容器内/data目录挂载,实现数据共享 |
mfa align | MFA核心对齐命令 |
audio_dir | 音频文件存放目录,支持子目录递归查找 |
transcripts.txt | 文本转录本文件,格式要求:每行格式为文件名 转录文本(文件名不含扩展名) |
output_dir | 对齐结果输出目录,默认生成TextGrid格式标注文件 |
english | 预训练语言模型名称,完整支持列表见MFA官方文档 |
若需使用自定义声学模型或词典,可通过额外挂载模型目录实现:
bashdocker run -it --rm \ -v $(pwd)/mfa_data:/data \ -v $(pwd)/custom_models:/models \ # 挂载本地自定义模型目录 montrealcorpustools/montreal-forced-aligner \ mfa align \ /data/audio_dir \ /data/transcripts.txt \ /data/output_dir \ /models/custom_language_model # 指定自定义模型路径
对齐成功后,output_dir目录下将生成与音频文件同名的TextGrid格式标注文件,包含以下层级标注:
--memory=8g),避免内存溢出您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 版本下载页面。
探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式
通过 Docker 登录认证访问私有仓库
无需登录使用专属域名
Kubernetes 集群配置 Containerd
K3s 轻量级 Kubernetes 镜像加速
VS Code Dev Containers 配置
Podman 容器引擎配置
HPC 科学计算容器配置
ghcr、Quay、nvcr 等镜像仓库
Harbor Proxy Repository 对接专属域名
Portainer Registries 加速拉取
Nexus3 Docker Proxy 内网缓存
需要其他帮助?请查看我们的 常见问题Docker 镜像访问常见问题解答 或 提交工单
manifest unknown
no matching manifest(架构)
invalid tar header(解压)
TLS 证书失败
DNS 超时
410 Gone 排查
402 与流量用尽
401 认证失败
429 限流
D-Bus 凭证提示
413 与超大单层
来自真实用户的反馈,见证轩辕镜像的优质服务