AAAIDec, 2023

攻击何时何地?一种基于因果关系的生成反事实对抗样本的方法

TL;DR通过考虑因果生成过程,我们通过因果关系解释深度神经网络脆弱性的源头,给出了理论结果来回答攻击的目标所在。为了更真实地生成对抗性示例,我们提出了 CADE 框架,可以生成反事实的对抗性示例,并在白盒、基于迁移的以及随机干预攻击等各种攻击场景中表现出竞争力。