ICLRFeb, 2024

学习对抗性扰动的理论理解

TL;DR理论框架揭示了扰动中包含了足够的类别特征以实现泛化,并且学习扰动的决策边界与标准样本的决策边界在大部分区域上相一致。