IJCAIMay, 2019

利用对抗训练模型中的潜在层漏洞

TL;DR本研究通过对鲁棒性模型的分析,发现相对于输入层抗攻击性较强的特征层是高度容易受到小幅度形变攻击的。在此基础上,我们提出了一种名为 LAT 的新技术,通过对已经进行对抗性训练的模型进行微调,以保证其特征层的鲁棒性。研究表明此方法对 MNIST、CIFAR-10 和 CIFAR-100 数据集的前沿对抗准确度有轻微提升。