Feb, 2024

关于 $l_0$ 有界对抗攻击的对抗训练的泛化性质

TL;DR神经网络在输入上的微小扰动会导致错误分类,本文针对截断分类器的 l0 有界对抗攻击进行理论性能分析,证明了一个独立于分布的二分类设置的 l0 有界对抗扰动的新型泛化界限。