Jun, 2024

2023 年位移式演讲者脱机化挑战的系统描述

TL;DR这篇论文描述了我们对会话环境中演讲者和语言进行辨认的解决方案,我们使用了语音活动检测、基于 Resnet 架构的 CNN 进行特征提取以及基于谱聚类的特征聚类。尽管未使用印地语进行训练,所描述的算法在数据集的开发和阶段 1 评估部分获得了 DER 分别为 27.1% 和 27.4% 的指标。