Jan, 2024

MF-AED-AEC: 利用多模态融合、ASR 错误检测和 ASR 错误修正进行语音情感识别

TL;DR本文介绍了一种引入 ASR 错误检测和修正的辅助任务来增强 ASR 文本的语义连贯性,并进一步提出了一种新颖的多模态融合方法,名为 MF-AED-AEC。实验结果表明,MF-AED-AEC 在性能上显著优于基线模型 4.1%。