Jul, 2024

基于多架构编码器和特征融合的面部情感识别——ABAW7挑战赛

TL;DR本文介绍了我们在第七次 ABAW 比赛中应对挑战的方法。比赛包括三个子挑战:情绪价值(VA)估计、表情(Expr)分类和动作单元(AU)检测。为了解决这些挑战,我们采用了先进的模型来提取强大的视觉特征。随后,我们利用 Transformer 编码器来整合这些特征,用于 VA、Expr 和 AU 子挑战。为了减轻特征尺寸变化的影响,我们引入了一个仿射模块,将特征对齐到一个公共维度。总体上,我们的结果明显优于基线。