Jul, 2023

鲁棒的排名解释

TL;DR机器学习模型解释的鲁棒性对于建立人类对模型的信任至关重要,本研究提出了用于衡量显著特征排名稳定性的解释厚度,并通过设计R2ET算法以最大化厚度来保护易受攻击的梯度解释,实验证明R2ET在隐蔽攻击下具有更高的解释鲁棒性并保持准确性。