ICLROct, 2017

利用输入变换对抗图像进行对抗

TL;DR探讨了采用图像转换策略,如降低位深、JPEG 压缩、总变量最小化和图像镶嵌等方法,以防御对图像分类系统的对抗性攻击。在 ImageNet 上的实验表明,总变量最小化和图像拼接是非常有效的防御方法,在网络对转换后的图片进行训练时表现尤为突出。最好的防御方法可以消除各种主要攻击方法的 60% 的强度灰盒和 90% 的强度黑盒攻击。