Feb, 2021

SPADE: 用于黑盒对抗鲁棒性评估的谱方法

TL;DR本文提出了一个黑盒谱方法SPADEF,用于评估给定机器学习模型的对抗鲁棒性,它利用了构建输入/输出数据对应的流形的逆距离映射来进行,并通过广义Courant-Fischer定理提出了用于评估经过证明可以作为在流形设置下最佳Lipschitz常数的上界的SPADE分数。此外,通过利用占优广义特征向量,本文还开发了一种谱图嵌入过程,以揭示最易受到对抗攻击的最不鲁棒数据样本,并为更有效的对抗训练提供支持。经实验证明,所提出的SPADE方法对使用MNIST和CIFAR-10数据集进行对抗训练的神经网络模型具有良好的实验结果。