Mar, 2024

MIPS 在 SemEval-2024 任务 3 中:利用多模态语言模型进行对话中的多模态情绪原因对抽取

TL;DR通过整合文本、音频和视觉模态的专门情感编码器,我们提出了一种新颖的多模态情感识别和多模态情感因果抽取(MER-MCE)框架,与其他顶级团队相比,我们的方法利用模态特定特征来增强情感理解和因果推断,并进行了实验性评估来展示其优势,我们的成绩在加权 F1 得分中排名第三,仅相差 0.0339 分以及第一名队伍,相差 0.0025 分以及第二名队伍。