ICMLJul, 2018

在训练中隐式生成随机噪声模型以提高对抗鲁棒性

TL;DR本文介绍了一种基于噪声的先验学习(NoL)方法,用于训练神经网络,使其具有内在的对抗攻击鲁棒性。该方法将具有相同损失函数的随机噪声进行隐式生成建模,并通过主成分分析的可视化工具来进一步理解对抗数据。我们的分析表明,在高排名的主成分上具有更高方差的模型,通常表现出对抗鲁棒性。我们展示了使用我们方法学习的模型对广泛攻击具有很好的性能,即使在白盒和黑盒攻击情况下和与最先进的对抗训练相结合,扩展了模型的鲁棒性,甚至超出其对抗训练的范围。