攻击何时何地？一种基于因果关系的生成反事实对抗样本的方法

AAAIDec, 2023

攻击何时何地？一种基于因果关系的生成反事实对抗样本的方法

Where and How to Attack? A Causality-Inspired Recipe for Generating Counterfactual Adversarial Examples

Ruichu Cai, Yuxuan Zhu, Jie Qiao, Zefeng Liang, Furui Liu...

TL;DR通过考虑因果生成过程，我们通过因果关系解释深度神经网络脆弱性的源头，给出了理论结果来回答攻击的目标所在。为了更真实地生成对抗性示例，我们提出了 CADE 框架，可以生成反事实的对抗性示例，并在白盒、基于迁移的以及随机干预攻击等各种攻击场景中表现出竞争力。

Abstract

Deep neural networks (DNNs) have been demonstrated to be vulnerable to well-crafted \emph{adversarial examples}, which are generated through either well-conceived $\mathcal{L}_p$-norm restricted or unrestricted attacks. Nevertheless, the majority of those approaches assume that adversa

adversarial examples dnn vulnerability causality attack interventions cade framework

发现论文，激发创造

CausalAdv：因果视角下的对抗鲁棒性

本文利用因果分析来建模敌对攻击的产生过程，并定义敌对分布以形式化敌对攻击的直观；通过因果解释，本文提出了一种由 Causal inspired Adversarial distribution alignment 方法，CausalAdv，以消除自然分布和敌对分布之间差异的方法，并证明了该方法的有效性。

Jun, 2021

深度学习中的对抗性示例：攻击与防御

本文研究深度学习中的对抗样本问题，总结了生成对抗样本的方法，提出了对抗样本的应用分类，并探讨了对抗样本的攻击和防御策略以及面临的挑战和潜在解决方案。

Dec, 2017

CAAD 2018: 迭代性集成对抗攻击

本文提出了一种针对图像分类器集合的迭代式对抗攻击方法，通过此方法，在 CAAD 2018 针对性对抗攻击竞赛中获得第五名，该方法提高了黑匣子对抗攻击的成功率。

Nov, 2018

AI-GAN：攻击启发的对抗样本生成

本文提出了一种新的框架 Attack-Inspired GAN，它可以通过联合训练的生成器、鉴别器和攻击器，以更有效的方式生成攻击性畸变，从而实现对图像分类任务的攻击成功率提高和生成时间的减少。

Feb, 2020

自然语言处理中深度学习模型的对抗攻击调查

该研究综述了最近针对文本深度神经网络攻击的研究。通过研究，讨论了现有攻击对文本数据不可直接应用的问题，并提出了关于这个话题的建议。

Jan, 2019

对抗性反事实视觉解释

本文提出了一种由扰动攻击变成语义上的有意义的扰动来进行反事实解释的方法，该方法在扰动攻击时使用去噪扩散概率模型以避免高频率和超出分布的扰动，从而使得研究目标模型不受其鲁棒性水平的限制。通过在多个测试平台上的实验验证，我们的反事实解释方法展现出明显的优势。

Mar, 2023

面向对抗样本具鲁棒性的深度神经网络架构

该研究论文研究了深度神经网络的鲁棒性问题，特别是针对对抗样本的攻击。通过探索神经网络的结构，拓扑结构，预处理和训练策略等方面来提高深度神经网络的抗干扰能力，并且通过引入平滑性惩罚来提高其稳健性。

Dec, 2014

基于因果分析的归因检测对抗样本

使用涉及一系列方法来解释机器学习模型的决策，研究表明这种方法可以用于确定高属性特征的影响并检测出恶意攻击。

Mar, 2019

使用受限对抗样本解释深度学习模型

研究机器学习算法的解释性问题，提出通过生成反事实的解释来描述不同的结果，并介绍了一种名为 “Constrained Adversarial Examples” 的新方法，该方法可以用于实际应用，包括处理分类属性和范围约束等领域的限制。

Jun, 2019

针对 DNN 的实用无盒对抗攻击

通过使用少量的样本，本研究提出了三种机制进行训练，其中原型重建是最有效的，生成的对抗性样本可成功地转移至各种图像分类和面部验证模型，最终的应用结果显示我们的方法能够显著降低商业名人识别系统的预测准确率近 15.4％。

Dec, 2020