May, 2022

利用 Kendall 排名相关性与余弦相似性之间的关系进行归属保护

TL;DR本文提出了积分梯度正则化 (IGR) 方法,可以通过最大化自然和扰动归因之间的余弦相似度来获得健壮的模型归因,从而提高模型的对抗性稳健性。在不同模型和数据集上的实验验证了我们的分析结果。