Aug, 2023

衡量因果解缠对神经网络模型对抗鲁棒性的影响

TL;DR量化研究表明,因果神经网络模型通过解耦因果和混淆信号,在对抗性攻击、少样本学习和罕见上下文分类等任务中表现出高的鲁棒性,但尚未进行定量研究以衡量这类因果模型所实现的解耦程度及其与对抗性鲁棒性的关系。本论文使用计算机视觉领域的内容 / 风格解耦计量指标来测量四种最先进的因果神经网络模型的不同因果解耦方面,发现模型解耦因果信号和混淆信号的程度与对抗鲁棒性之间存在显著相关性(r=0.820,p=0.001),同时发现混淆信号在像素级别的信息内容与对抗鲁棒性呈负相关(r=-0.597,p=0.040)。