Feb, 2021

输入梯度是否突出显示区别特征?

TL;DR本文提出一种评估框架 DiffROAR 和 MNIST 半真实数据集 BlockMNIST,用于检验模型对输入梯度的响应,研究表明采用对抗性模型可以更好的体现输入梯度的任务特征,这一发现为提高解释性提供了启示。