Jul, 2024

FineCLIPER:用于动态面部表情识别的多模态细粒度 CLIP 与 AdaptERs

TL;DR提出了一种名为 FineCLIPER 的新型多模态细粒度动态面部表情识别框架,通过使用文本描述进行监督,采用层次化的方式挖掘 DFE 视频中的有用线索,并使用 Parameter-Efficient Fine-Tuning 实现大规模预训练模型的高效自适应。实验证明 FineCLIPER 在有监督和零样本设置下,在 DFEW、FERV39k 和 MAFW 数据集上均取得了最先进的性能。