Oct, 2022

评分黑盒模型的对抗鲁棒性

TL;DR研究了深度神经网络对抗攻击的鲁棒性,提出了一种适用于黑盒模型的简单评分方法,并发现更鲁棒的模型具有更小的 LIME 权重 l1 范数和更锐利的解释。