Aug, 2023

通过加权相关累加实现通用注意力模型的解释性

TL;DR我们提出了一种加权相关性策略,考虑了令牌值的重要性,以减少在平等累积相关性时的失真。通过 CLIP 编码器和后续的映射器,我们提出了统一的基于 CLIP 的两阶段模型,命名为 CLIPmapper,用于处理视觉和语言任务,通过自注意、交叉注意、单模态和交叉模态注意,这使得我们的通用可解释性方法更加合适。对视觉问答和图像字幕进行的广泛扰动测试证实了我们的可解释性方法优于现有的方法。