Nov, 2024
MSA-ASR:利用冻结的ASR模型进行高效多语种说话人归属
MSA-ASR: Efficient Multilingual Speaker Attribution with frozen ASR
Models
TL;DR本研究解决了现有说话人归属自动语音识别(SA-ASR)方法的复杂性和适应性不足的问题。提出了一种新颖的方法,利用冻结的多语种ASR模型,通过弱标签预测说话人嵌入,进行说话人归属,且无需对ASR模型进行额外修改。实验结果表明,该方法在多语种数据集上表现出强大的竞争力,具有良好的实际应用潜力。