Apr, 2024

PASA: 使用预测和归因敏感性分析的攻击不可知的无监督对抗检测

TL;DR深度神经网络在分类方面容易受到对抗性攻击影响,本文提出了一种基于特征归因的方法来检测对抗样本,其能够可靠地检测到对抗样本,并在性能上优于目前最先进的统计无监督对抗检测器。