Jan, 2022

基于双向注意力对多模态情感识别的群门融合

TL;DR本文提出了一种新的模型 —— 门控双向对齐网络(GBAN),该模型利用注意力机制的双向对齐网络和一种新颖的分组门控融合层来明确捕捉语音和文本之间的对齐关系,并在不同模态中集成表示,从而在 IEMOCAP 数据集上优于现有的最先进的多模态方法。