AAAIJan, 2021

对抗攻击归因:发现对抗机器学习攻击中的可归因信号

TL;DR通过简单的监督式学习实验平台,发现在 CIFAR-10 和 MNIST 数据集中,可以区分使用不同攻击算法、模型和超参数生成的对抗攻击,并介绍了对抗攻击归因的概念。