Sep, 2019

度量学习用于对抗性鲁棒性

TL;DR通过对 PGD 攻击下的深度表示的实证分析,我们发现攻击会导致内部表示向 “误分类” 类别移动。基于此观察,我们提出了使用度量学习来规范攻击下的表示空间,从而产生更强健的分类器。通过精心抽样度量学习实例,我们的学习表示不仅提高了鲁棒性,还可以检测先前未见过的对抗性样本。量化实验表明,相对于以前的工作,我们的方法使得鲁棒性准确度提高了 4%,检测效率提高了 6%。