May, 2023

ARBEx: 针对健壮面部表情学习的注意力特征提取与可靠性平衡

TL;DR本文介绍了一种新的注意力特征提取框架 ARBEx,该框架由 Vision Transformer 驱动,具有可靠性平衡功能,可以应对面部表情学习任务中的类别分布不佳、偏差和不确定性。与基于窗口的交叉注意力 ViT 一起,我们加强了几种数据预处理和细化方法,同时在嵌入空间中引入了学习型锚点、标签分布和多头自我注意机制,以优化性能,减弱标签预测中的弱预测,从而增强标签预测的韧性。同时,引入了锚损失,以鼓励锚点之间的大间隔,提高模型的辨别能力。通过大量实验,在各种情境下,我们的方法优于目前最先进的方法。