MMOct, 2023

基于自我蒸馏的多模态会话情感识别的 Transformer 模型

TL;DR本文提出了一种基于自蒸馏 (SDT) 的基于变压器模型,该模型通过利用变压器来捕捉内部和跨模式之间的相互作用,并通过设计分层门控融合策略来动态学习模式之间的权重,并将所提出模型的软标签作为额外的训练监督,从而学习更具表现力的模式表示,实验证明 SDT 在 IEMOCAP 和 MELD 数据集上优于之前的最先进基线模型。