Jan, 2022

具有可证明估计误差的深度神经网络最小对抗扰动

TL;DR本文提出了两种轻量级策略来找到最小的对抗扰动,区别于现有技术,该方法允许对近似距离相对于理论距离进行误差估计理论,得到了实验结果的支撑,表明该方法适用于靠近分类边界的样本,具有抗击任何对抗性攻击的证明鲁棒性保证。