Aug, 2023

动态面部表情识别中激励视觉 - 语言模型

TL;DR该论文介绍了一种名为 DFER-CLIP 的新型视觉语言模型,它基于 CLIP 模型,用于野外动态面部表情识别 (DFER)。该模型包括视觉部分和文本部分,通过提取时序面部表情特征和学习上下文信息,实现了与当前监督 DFER 方法相比的最先进结果。