衡量因果解缠对神经网络模型对抗鲁棒性的影响

Aug, 2023

衡量因果解缠对神经网络模型对抗鲁棒性的影响

Measuring the Effect of Causal Disentanglement on the Adversarial Robustness of Neural Network Models

Preben M. Ness, Dusica Marijan, Sunanda Bose

TL;DR量化研究表明，因果神经网络模型通过解耦因果和混淆信号，在对抗性攻击、少样本学习和罕见上下文分类等任务中表现出高的鲁棒性，但尚未进行定量研究以衡量这类因果模型所实现的解耦程度及其与对抗性鲁棒性的关系。本论文使用计算机视觉领域的内容 / 风格解耦计量指标来测量四种最先进的因果神经网络模型的不同因果解耦方面，发现模型解耦因果信号和混淆信号的程度与对抗鲁棒性之间存在显著相关性（r=0.820，p=0.001），同时发现混淆信号在像素级别的信息内容与对抗鲁棒性呈负相关（r=-0.597，p=0.040）。

Abstract

causal neural network models have shown high levels of robustness to adversarial attacks as well as an increased capacity for generalisation tasks such as few-shot learning and rare-context classification compare

causal neural network models adversarial attacks disentanglement adversarial robustness content/style disentanglement

发现论文，激发创造

CausalAdv：因果视角下的对抗鲁棒性

本文利用因果分析来建模敌对攻击的产生过程，并定义敌对分布以形式化敌对攻击的直观；通过因果解释，本文提出了一种由 Causal inspired Adversarial distribution alignment 方法，CausalAdv，以消除自然分布和敌对分布之间差异的方法，并证明了该方法的有效性。

Jun, 2021

强若不倒的分离因果机制：验证深度表达对干预健壮性的有效性

通过因果视角提供了一种新的方法来量化深度潜变量模型，并提供了一个高效的估算方法。

Oct, 2018

通过使用解缠表示进行对抗混合实现野外的稳健性

本文提出一种新的方法来达到对真实世界输入的鲁棒性，该方法利用了分解输入的表示来定义不同的变化因素，并通过对不同图像的表示进行对抗组合生成新的输入图像。我们使用 StyleGAN 模型来证明这一框架的有效性，并通过训练模型对真实世界的变化进行了不变性训练，从而改善了模型的泛化能力，并降低了冗余相关性的影响。

Dec, 2019

神经网络鲁棒性解释和评估

该研究提出了一种定量指标来评估神经网络模型的内在稳健性，并通过损失可视化的方式解释了对抗攻击和防御机制。该指标具有快速生成、结构和参数规模无关、可靠性高的优点，并提供了一种相对于不同测试设置不变的评估方法。

May, 2019

通过特征解缠缚来缓解对抗鲁棒性中的特征差距

我们提出了一种基于潜在特征解缠的方法，以明确建模并进一步消除导致特征差异的潜在特征，从而提高深度神经网络对抗样本的鲁棒性。实证评估表明，我们的方法超越了现有的对抗微调方法和对抗训练基线。

Jan, 2024

异质数据空间个体公平性和鲁棒性的因果对抗扰动

我们提出了一种新颖的方法，通过研究个体公平性、对抗鲁棒性和结构因果模型之间的关系，特别是在处理离散敏感属性时，来实现个体公平性、对抗鲁棒性和因果性的综合应用。通过引入新的因果对抗扰动和对抗训练，我们创建了一个将个体公平性、因果性和鲁棒性相结合的新的正则化项，并在真实世界和合成数据集上对我们的方法进行了评估，证明了其在实现公平、对抗鲁棒和因果感知的分类器方面的有效性。

Aug, 2023

探索稳健特征以提升对抗性鲁棒性

通过分离鲁棒特征和领域特定特征，我们提出了一个鲁棒特征分离模型，以增强模型的对抗性鲁棒性。同时，训练出的领域鉴别器几乎完美地能够识别出干净图像和对抗性样本中的领域特定特征，从而无需额外的计算成本实现对抗性样本的检测。这样一来，我们可以为干净图像和对抗性样本指定不同的分类器，避免了干净图像准确率的降低。

Sep, 2023

信息论视角下的解耦文本表示学习对抗性鲁棒性

本文从可分离表示学习的角度解决了对抗鲁棒性的挑战，并设计了一个可分离学习网络来估计互信息，实验证明该方法在对抗攻击下显著优于代表性方法，强调舍弃非鲁棒性特征对于提高对抗鲁棒性至关重要。

Oct, 2022

生成对抗网络中的对比式解缠

本文从对比学习的角度提出了一种新的对抗生成网络（CD-GAN）来解决因潜变量的后验推断和缺乏样本似然性而难以实现的生成模型因果解释的问题，它通过对比图像特征来实现对数据中不同类之间可辨别属性的提取，并通过仅有的有限监督来提高模型的性能。实验结果表明了该模型在多个数据集上对数据进行高效的可解释性特征提取。

Mar, 2021

负样本无关对比学习的解缠实证研究

本文提出了一种新的基于互信息的解缠度度量来研究负样本自由对比学习方法的解缠特性。作者在高维表示空间中将负样本自由对比学习方法引入解缠表示学习领域，并通过对流行的合成数据集和真实世界 CelebA 数据集的实验表明，该方法可以学到一个良好的解缠表示子集。

Jun, 2022