CVPRJun, 2022

基于多模态融合网络的对话情感识别技术(M2FNet)

TL;DR本篇研究利用多模态方法提高情感识别的准确性,提出了一种多模态融合网络 M2FNet,利用视觉、音频和文本模态提取情感相关特征,并使用多头注意力机制进行融合。经实验验证,该方法在 MELD 和 IEMOCAP 数据集上表现显著优于其他方法,达到了情感识别领域的最新性能表现。