ICLRAug, 2016

检测对抗样本的早期方法

TL;DR本研究使用三种方法检测机器学习分类器所遭受的对抗性扰动,其中最佳检测方法显示对抗性图像在 PCA 下的低排名主要成分上存在异常强调。