May, 2023

SI-LSTM: 会话中情感识别的说话人混合长短期记忆和跨模态注意力

TL;DR本研究提出了一种名为 “讲话者信息增强的长短时记忆(SI-LSTM)” 的递归结构,用于情感识别,可以在追踪对话中不同讲话者的情感状态的同时,通过交叉模态注意力机制将不同模态之间的信息结合起来,提高多模态数据情感识别任务的学习效果。在两个基准数据集上进行的实验结果表明,所提出的 SI-LSTM 模型在情感识别任务上具有优越的性能表现。