轩辕镜像
轩辕镜像专业版
个人中心搜索镜像
交易
充值流量我的订单
工具
工单支持镜像收录Run 助手IP 归属地密码生成Npm 源Pip 源
帮助
常见问题我要吐槽
其他
关于我们网站地图

官方QQ群: 13763429

轩辕镜像
镜像详情
lintoai/linto-diarization-pyannote
官方博客使用教程热门镜像工单支持
本站面向开发者与科研用户,提供开源镜像的搜索和下载加速服务。
所有镜像均来源于原始开源仓库,本站不存储、不修改、不传播任何镜像内容。
轩辕镜像 - 国内开发者首选的专业 Docker 镜像下载加速服务平台 - 官方QQ群:13763429 👈点击免费获得技术支持。
本站面向开发者与科研用户,提供开源镜像的搜索和下载加速服务。所有镜像均来源于原始开源仓库,本站不存储、不修改、不传播任何镜像内容。

本站支持搜索的镜像仓库:Docker Hub、gcr.io、ghcr.io、quay.io、k8s.gcr.io、registry.gcr.io、elastic.co、mcr.microsoft.com

linto-diarization-pyannote Docker 镜像下载 - 轩辕镜像

linto-diarization-pyannote 镜像详细信息和使用指南

linto-diarization-pyannote 镜像标签列表和版本信息

linto-diarization-pyannote 镜像拉取命令和加速下载

linto-diarization-pyannote 镜像使用说明和配置指南

Docker 镜像加速服务 - 轩辕镜像平台

国内开发者首选的 Docker 镜像加速平台

极速拉取 Docker 镜像服务

相关 Docker 镜像推荐

热门 Docker 镜像下载

linto-diarization-pyannote
lintoai/linto-diarization-pyannote

linto-diarization-pyannote 镜像详细信息

linto-diarization-pyannote 镜像标签列表

linto-diarization-pyannote 镜像使用说明

linto-diarization-pyannote 镜像拉取命令

Docker 镜像加速服务

轩辕镜像平台优势

镜像下载指南

相关 Docker 镜像推荐

LinTO-diarization是LinTO的说话人分轨服务,可猜测说话人数,若提供语音样本还能识别说话人,支持作为独立服务或微服务部署。
0 次下载activelintoai镜像
🚀轩辕镜像专业版更稳定💎一键安装 Docker 配置镜像源
中文简介版本下载
🚀轩辕镜像专业版更稳定💎一键安装 Docker 配置镜像源

linto-diarization-pyannote 镜像详细说明

linto-diarization-pyannote 使用指南

linto-diarization-pyannote 配置说明

linto-diarization-pyannote 官方文档

LinTO-diarization 技术文档

1. 镜像概述和主要用途

LinTO-diarization 是 LinTO 平台的说话人分轨服务,具备猜测说话人数以及在提供目标说话人语音样本时识别特定说话人的能力。该服务可作为独立分轨服务部署,也可作为微服务集成到分布式系统中。

2. 核心功能和特性

  • 灵活部署模式:支持独立 HTTP API 服务或微服务(通过 Celery 与消息代理)两种部署方式
  • 说话人分轨能力:自动猜测说话人数或指定固定/最大说话人数
  • 说话人识别:在提供目标说话人语音样本时,可识别特定说话人身份
  • 多接口支持:提供 HTTP API(含 OpenAPI 文档)和消息队列两种调用方式
  • 资源优化:通过共享文件夹处理大音频文件,避免消息代理数据拥塞
  • GPU 加速:支持 CPU/GPU 运行,可配置多设备资源

3. 使用场景和适用范围

  • 独立分轨服务:需通过 HTTP API 直接调用说话人分轨功能的场景
  • 微服务架构:集成到基于消息队列的分布式语音处理系统(如 LinTO 生态)
  • 语音内容分析:会议记录、访谈录音等场景的说话人分离与统计
  • 语音转写后处理:为语音转写结果添加说话人标签

4. 前提条件

4.1 基础依赖

  • Docker:需安装并运行 Docker 环境
  • 网络:部署微服务模式时需消息代理(如 Redis)
  • 存储:需共享文件夹(挂载至容器 /opt/audio)存储音频文件,避免大文件通过消息代理传输

4.2 说话人识别依赖

若启用说话人识别功能,需部署 Qdrant 向量数据库存储说话人嵌入向量:

docker run \
    -p 6333:6333 \  # Qdrant 默认端口
    -v ./qdrant_storage:/qdrant/storage:z \
    qdrant/qdrant

5. 部署指南

5.1 镜像获取

5.1.1 构建镜像

git clone [***]
cd linto-diarization
docker build . -t linto-diarization-pyannote:latest -f pyannote/Dockerfile 

5.1.2 拉取镜像

docker pull lintoai/linto-diarization-pyannote

5.2 HTTP 独立服务模式

通过 HTTP API 提供独立分轨服务。

5.2.1 配置 .env 文件

参考 pyannote/.envdefault 创建 .env 文件,配置参数见 6. 配置参数说明。

5.2.2 运行容器

docker run --rm \
-v <宿主机共享文件夹路径>:/opt/audio \  # 挂载共享音频文件夹
-p <宿主机端口>:80 \  # 映射容器 80 端口到宿主机(如 8080:80)
--env-file .env \  # 加载环境变量
# 启用 GPU(如有)
--gpus all \  # 可选,启用所有 GPU
linto-diarization-pyannote:latest

5.2.3 启用说话人识别

需挂载说话人语音样本文件夹(样本需按说话人名称命名文件/文件夹):

docker run ... -v </path/to/speaker/samples>:/opt/speaker_samples  # 或自定义路径(通过 SPEAKER_SAMPLES_FOLDER 指定)

若需复用 Qdrant 现有向量集合,设置环境变量 QDRANT_RECREATE_COLLECTION=false。

5.3 Celery 微服务模式

作为微服务部署,通过 Celery 监听消息代理中的分轨任务。

5.3.1 前置条件

  • 消息代理(如 Redis)已部署,地址通过 SERVICES_BROKER 配置
  • 共享文件夹已挂载(同 4.1)

5.3.2 配置 .env 文件

基础参数同 HTTP 模式,额外添加微服务特有参数(见 6. 配置参数说明)。

5.3.3 启动容器(docker-compose)

创建 docker-compose.yml:

version: '3.7'

services:
  diarization-service:
    image: linto-diarization-pyannote:latest
    volumes:
      - /path/to/shared/folder:/opt/audio  # 共享音频文件夹
    env_file: .env  # 加载环境变量
    deploy:
      replicas: 1  # 根据需求调整副本数
    networks:
      - your-net  # 连接至微服务网络

networks:
  your-net:
    external: true  # 使用现有网络

启动服务:

docker stack deploy --resolve-image always --compose-file docker-compose.yml your_stack

6. 配置参数说明

6.1 通用环境变量

变量名描述示例值
SERVING_MODE部署模式(必填):http(独立服务)或 task(微服务)http 或 task
CONCURRENCY主工作进程外的额外工作进程数0 | 1 | 2
DEVICE嵌入模型运行设备(默认:优先 GPU,否则 CPU)cpu | cuda | cuda:0
DEVICE_CLUSTERING聚类模型运行设备(默认同 DEVICE)cpu | cuda
DEVICE_IDENTIFICATION说话人识别模型运行设备(默认同 DEVICE)cpu | cuda
NUM_THREADSCPU 最大线程数4
CUDA_VISIBLE_DEVICESGPU 设备索引(多 GPU 时指定,需配合 --gpus 参数)0 | 1,2
SPEAKER_SAMPLES_FOLDER说话人语音样本文件夹路径(默认:/opt/speaker_samples)/path/to/samples
SPEAKER_PRECOMPUTED_FOLDER预计算嵌入向量存储路径(默认:/opt/speaker_precomputed)/path/to/precomputed
QDRANT_HOSTQdrant 服务地址(说话人识别时必填)localhost
QDRANT_PORTQdrant 服务端口(默认 6333)6333
QDRANT_COLLECTIONQdrant 向量集合名称(默认 speaker_embeddings)my_collection
QDRANT_RECREATE_COLLECTION是否重建 Qdrant 集合(默认 true,复用集合时设为 false)true | false

6.2 微服务模式特有变量

变量名描述示例值
SERVICES_BROKER消息代理地址(如 Redis)redis://my_redis_broker:6379
BROKER_PASS消息代理密码(可选)my_password
QUEUE_NAME任务队列名称(默认自动生成)diarization_queue
SERVICE_NAME服务名称diarization-ml
LANGUAGEBCP-47 语言代码en-US | *(多语言)
MODEL_INFO模型描述信息Multilingual diarization model

7. 使用方法

7.1 HTTP API

7.1.1 健康检查 /healthcheck

  • 方法:GET
  • 描述:返回服务状态
  • 响应:"1"(服务正常)

7.1.2 分轨接口 /diarization

  • 方法:POST

  • 请求参数:

    • file:WAV 音频文件(必填)
    • speaker_count:固定说话人数(可选,整数,自动聚类时留空)
    • max_speaker:最大说话人数(可选,整数,当 speaker_count 未指定时生效)
    • speaker_names:目标说话人名称(可选,仅在提供语音样本时生效):
      • 空字符串 "":禁用识别
      • "*":识别所有说话人
      • JSON 数组或 | 分隔字符串:指定说话人列表(如 ["spk1","spk2"] 或 "spk1|spk2")
  • 响应示例(application/json):

{
  "speakers": [
    {"spk_id": "spk5", "duration": 2.2, "nbr_seg": 1}
  ],
  "segments": [
    {"seg_id": 1, "spk_id": "spk5", "seg_begin": 0.0, "seg_end": 2.2}
  ]
}

7.1.3 API 文档 /docs

  • 描述:提供 OpenAPI/Swagger 交互式文档界面

7.2 消息代理调用(微服务模式)

通过消息代理(如 Redis)提交分轨任务,参数同 HTTP API,区别在于 file 为共享文件夹中的相对路径。

任务参数

  • file:共享文件夹中音频文件的相对路径(字符串,必填)
  • speaker_count、max_speaker、speaker_names:同 HTTP API(可选)

响应格式

同 /diarization 接口响应(JSON 结构)。

8. 测试示例

8.1 HTTP API 测试(curl)

curl -X POST "http://<服务地址>:<端口>/diarization" \
  -H "accept: application/json" \
  -H "Content-Type: multipart/form-data" \
  -F "file=@test.wav;type=audio/x-wav" \
  -F "speaker_count=2"

9. 许可证

本项目基于 AGPLv3 许可证开源(详见 LICENSE)。

10. 依赖说明

  • 基于 PyAnnote 分轨框架(MIT 许可证)。
查看更多 linto-diarization-pyannote 相关镜像 →
lintoai/linto-diarization-simple logo
lintoai/linto-diarization-simple
by lintoai
LinTO-diarization是LinTO的说话人分离服务,可猜测说话人数,若提供语音样本还能识别说话人,支持作为独立HTTP服务或微服务部署。
50K+ pulls
上次更新:4 个月前
lintoai/linto-stt-kaldi logo
lintoai/linto-stt-kaldi
by lintoai
LinTO-STT-Kaldi是基于Kaldi训练模型的自动语音识别(ASR)API,支持作为独立转录服务或通过消息代理连接器部署于微服务架构,提供离线及实时转录功能。
150K+ pulls
上次更新:1 个月前

常见问题

轩辕镜像免费版与专业版有什么区别?

免费版仅支持 Docker Hub 加速,不承诺可用性和速度;专业版支持更多镜像源,保证可用性和稳定速度,提供优先客服响应。

轩辕镜像免费版与专业版有分别支持哪些镜像?

免费版仅支持 docker.io;专业版支持 docker.io、gcr.io、ghcr.io、registry.k8s.io、nvcr.io、quay.io、mcr.microsoft.com、docker.elastic.co 等。

流量耗尽错误提示

当返回 402 Payment Required 错误时,表示流量已耗尽,需要充值流量包以恢复服务。

410 错误问题

通常由 Docker 版本过低导致,需要升级到 20.x 或更高版本以支持 V2 协议。

manifest unknown 错误

先检查 Docker 版本,版本过低则升级;版本正常则验证镜像信息是否正确。

镜像拉取成功后,如何去掉轩辕镜像域名前缀?

使用 docker tag 命令为镜像打上新标签,去掉域名前缀,使镜像名称更简洁。

查看全部问题→

轩辕镜像下载加速使用手册

探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式

🔐

登录方式进行 Docker 镜像下载加速教程

通过 Docker 登录方式配置轩辕镜像加速服务,包含7个详细步骤

🐧

Linux Docker 镜像下载加速教程

在 Linux 系统上配置轩辕镜像源,支持主流发行版

🖥️

Windows/Mac Docker 镜像下载加速教程

在 Docker Desktop 中配置轩辕镜像加速,适用于桌面系统

📦

Docker Compose 镜像下载加速教程

在 Docker Compose 中使用轩辕镜像加速,支持容器编排

📋

K8s containerd 镜像下载加速教程

在 k8s 中配置 containerd 使用轩辕镜像加速

🔧

宝塔面板 Docker 镜像下载加速教程

在宝塔面板中配置轩辕镜像加速,提升服务器管理效率

💾

群晖 NAS Docker 镜像下载加速教程

在 Synology 群晖NAS系统中配置轩辕镜像加速

🐂

飞牛fnOS Docker 镜像下载加速教程

在飞牛fnOS系统中配置轩辕镜像加速

📱

极空间 NAS Docker 镜像下载加速教程

在极空间NAS中配置轩辕镜像加速

⚡

爱快路由 ikuai Docker 镜像下载加速教程

在爱快ikuai系统中配置轩辕镜像加速

🔗

绿联 NAS Docker 镜像下载加速教程

在绿联NAS系统中配置轩辕镜像加速

🌐

威联通 NAS Docker 镜像下载加速教程

在威联通NAS系统中配置轩辕镜像加速

📦

Podman Docker 镜像下载加速教程

在 Podman 中配置轩辕镜像加速,支持多系统

📚

ghcr、Quay、nvcr、k8s、gcr 等仓库下载镜像加速教程

配置轩辕镜像加速9大主流镜像仓库,包含详细配置步骤

🚀

专属域名方式进行 Docker 镜像下载加速教程

无需登录即可使用轩辕镜像加速服务,更加便捷高效

需要其他帮助?请查看我们的 常见问题 或 官方QQ群: 13763429

商务:17300950906
|©2024-2025 源码跳动
商务合作电话:17300950906|Copyright © 2024-2025 杭州源码跳动科技有限公司. All rights reserved.