COLINGFeb, 2024

课程学习结合有向无环图进行多模态情感识别

TL;DR本文提出了一种多模态对话情感识别的新方法 MultiDAG+CL,该方法利用有向无环图 (DAG) 在统一框架中集成了文本、声学和视觉特征。该模型通过课程学习 (Curriculum Learning) 改善了情感变化和数据不平衡的挑战,逐渐呈现有意义顺序的训练样本来提高模型在处理情感变化和数据不平衡方面的性能,在 IEMOCAP 和 MELD 数据集上的实验结果表明,MultiDAG+CL 模型优于基准模型。