Jul, 2018

从模型解释中重建模型

TL;DR该研究通过理论和实验表明,基于梯度的模型解释快速揭示模型本身,该结果强调了梯度而不是标签作为学习原语。同时,该研究提出了有效的启发式方法,以重新构建从梯度说明中获得的模型。