Sep, 2020

基于注意力机制的多模态情感识别融合

TL;DR本论文提出了一种基于深度学习的方法,结合了文本和音频数据进行情绪分类,使用 SincNet 层提取音频特征,同时使用双向 RNN 和深度卷积神经网络提取文本特征,通过交叉注意力机制融合两种特征,在 IEMOCAP 数据集上取得了比现有方法更好的性能。