Mar, 2022

多方会议中说话人归属的自动语音识别的比较研究

TL;DR对在多方会议场景下的口语识别(SA-ASR)中的发言人进行的比较研究中,通过三种不同的方法进行了评估。结果表明,引入单词级别的划分模型可以有效降低时戳对准错误。同时,采用目标发言人分离模块和 ASR 模块联合训练可以显著提高 SA-ASR 的性能。