CVPRMar, 2023

对抗性反事实视觉解释

TL;DR本文提出了一种由扰动攻击变成语义上的有意义的扰动来进行反事实解释的方法,该方法在扰动攻击时使用去噪扩散概率模型以避免高频率和超出分布的扰动,从而使得研究目标模型不受其鲁棒性水平的限制。通过在多个测试平台上的实验验证,我们的反事实解释方法展现出明显的优势。