ICLRJan, 2024

尊重模型:精细和稳健的解释与共享比率分解

TL;DR我们提出了一种名为 SRD(共享比例分解)的新颖可解释 AI(XAI)方法,真实地反映了模型的推理过程,提高了解释的鲁棒性。通过采用向量视角考虑滤波器之间复杂的非线性相互作用,我们与传统的神经级别方法不同,我们引入了一个有趣的观察称为仅激活模式预测(APOP),让我们强调不活跃神经元的重要性,并重新定义了包含所有相关信息的相关性,包括活动和不活动的神经元。我们的方法 SRD 允许对逐点特征向量(PFV)进行递归分解,在任何层提供高分辨率的有效接收域(ERF)。