ICLRAug, 2018

结构性对抗攻击:向通用实现和更好的可解释性迈进

TL;DR本文提出一种名为 StrAttack 的结构化攻击模型,通过滑动掩模来提取关键的空间结构并具有更好的可解释性,该模型能够实现与现有攻击方法相同水平的 Lp 范数失真的强组稀疏化。实验证明 StrAttack 在 MNIST、CIFAR-10 和 ImageNet 数据集上的攻击效果是有效的。