Jun, 2023

可解释的多模态情感识别:利用面部特征和生理信号

TL;DR本文介绍了一种融合了多种多样信息的多模态框架,通过将来自视觉面部特征和视频输入中提取的 rPPG 信号的信息融合从而实现情感理解。基于排列特征重要性分析的解释性技术用于计算 rPPG 和视觉模态对将给定视频分类到特定情感类别的贡献。IEMOCAP 数据集上的实验表明,从多个模态组合的互补信息可以提高情感分类性能。