Feb, 2022

USTC-Ximalaya 系统在 ICASSP2022 多通道多方会议转录(M2MeT)挑战中的应用

TL;DR在多频道多方会议转录挑战中,我们提出了两种改进目标说话人语音活动检测技术,能够处理高重叠率,重音和嘈杂环境中的多人对话,并展示了我们的系统与经典聚类算法相比,在 ALIMEETING 语料库中将 DER 降低了长达 66.55/60.59%。