Nov, 2017
通过约束输入渐变来提高深度神经网络的对抗鲁棒性和可解释性
Improving the Adversarial Robustness and Interpretability of Deep Neural
Networks by Regularizing their Input Gradients
TL;DR本研究评估了不同防御机制对神经网络的有效性,发现使用输入梯度规则化训练的神经网络具有抵御小幅度扰动的鲁棒性,并且可以提高预测的可解释性。同时,对这种神经网络产生的误分类可以解释,并进一步讨论了深度神经网络中解释性和鲁棒性之间的关系。