Mar, 2024

主题 Diff: 一种用于多模态对话情绪检测的主题丰富扩散方法

TL;DR基于视觉、语言和声学等多模态,我们提出了一种面向多模态对话情感检测任务的主题丰富扩散(TopicDiff)方法,通过将扩散模型与神经主题模型相结合,解决了神经主题模型在捕获主题信息时存在的多样性缺失问题,并通过详细评估证明了 TopicDiff 在多模态情感检测任务中相对于最先进的基线方法的显著性改进,验证了多模态主题信息在此任务中的重要性以及 TopicDiff 捕获该信息的有效性。此外,我们还观察到声学和视觉主题信息相对于语言主题信息更具有区分性和鲁棒性的有趣发现。