Mar, 2024

改进实际会议应用中的发言人指派的语音识别

TL;DR优化使用演讲者归属自动语音识别(SA-ASR)系统在实际场景中,如 AMI 会议语料库,用于改进语音片段的演讲者分配的新颖研究,涉及语音活动检测(VAD)、发言者序列聚类(SD)和 SA-ASR 方面的流程。