ICMLMay, 2023

使用期望扰动分数通过探测多个扰动来检测对抗性数据

TL;DR本文提出了一种新的统计量 —— 期望扰动分数 (EPS),来计算两个样本之间的差异,为解决使用单一样本的平凡评分不足问题,将样本使用各种噪声扰动来捕捉其多视角观察,并基于 EPS-AD 提出了基于预训练扩散模型来估计 EPS 以对抗样本进行检测的新方法,该方法与最大平均偏差 (MMD) 相结合,证明了在自然样本之间,EPS-AD 检测到的差异较大,且通过实验展示了该方法的优越性。