MMJun, 2023

跨语言语音情感识别:使用多模态双重注意力变换器

TL;DR本研究提出了一个利用基于多模态双重注意力变换器模型,结合图注意力与协同注意力,以提高跨语言情感识别性能,在 4 个公开数据集中获得了优秀表现的方法。该方法在高层次特征表示方面利用 Transformer 编码层来提高情感分类精度,并通过在各个阶段对特征表示进行细化以提供情感显著特征,既保留特定模态的情感信息又增强了跨模态和跨语言交互。