AAAIMar, 2023

重新思考解释:深度视觉分类器的输入无关性显著性映射

TL;DR本文提出了一种新的输入无关的显著性地图方法,它从计算上估计模型对其输出所归属的高级特征并通过可解释的可视化展示,以更加准确和公正地解释模型的行为,同时在大规模模型中成功应用,并且通过识别受损分类器中的后门签名,展示了这种新形式显著性映射的另一个有趣的用途。