对抗鲁棒性的统一博弈理论解释

Nov, 2021

A Unified Game-Theoretic Interpretation of Adversarial Robustness

Jie Ren, Die Zhang, Yisen Wang, Lu Chen, Zhanpeng Zhou...

TL;DR提供了一个统一的观点来解释不同的对抗性攻击和防御方法，即 DNNs 输入变量之间的多阶交互视图。基于多阶交互，我们发现对抗性攻击主要影响高阶交互来愚弄 DNN。此外，我们发现对抗性训练的 DNN 的鲁棒性来自类别特定的低阶交互。我们的发现提供了一种潜在的方法来统一对抗性扰动和稳健性，可以从原则上解释现有的防御方法。此外，我们的发现也修正了先前关于对抗性学习特征的有关形状偏差的不准确理解。

Abstract

This paper provides a unified view to explain different adversarial attacks and defense methods, \emph{i.e.} the view of multi-order interactions

adversarial attacks dnns multi-order interactions defense methods robustness

发现论文，激发创造

面向对抗攻击具有抵抗能力的深度学习模型

通过稳健优化方法探究神经网络对抗攻击的鲁棒性，设计出对抗攻击和训练模型的可靠方法，提出对于一阶对手的安全保证，并得到针对广泛对抗攻击的高鲁棒性网络模型。

Jun, 2017

深度学习模型的整体对抗鲁棒性

该研究论文综述了深度学习模型对抗鲁棒性的研究主题和基本原则，包括攻击、防御、验证和新应用。

Feb, 2022

神经网络对抗鲁棒性的有用分类法

深度学习领域的对抗攻击和防御是目前研究的活跃领域。本文针对防御方法进行分类，提出了不同的分类方法：通过增加特征向量的类内紧凑性和类间分隔性来提高对抗鲁棒性，减小或移除非鲁棒图像特征来提高对抗鲁棒性。通过这种重新构架话题的方式，提供了新的视角，深入探讨使网络变得更加强健的潜在因素，启发了更多的解决方案。此外，文献中有一些关于对抗防御成本问题和鲁棒性与准确性之间的权衡的论述，但我们提出的分类方法可以解决这些问题。本文提出了几项挑战，以此推动深度学习研究的进一步发展。

Oct, 2019

对敌对鲁棒性的子网络贡献的理论视角

通过引入半鲁棒性概念，本论文开发了一个新的理论框架，研究子网络的鲁棒性对整个网络的影响，并在多个深度神经网络体系结构、数据集和对抗攻击中进行了实证验证。

Jul, 2023

统一方法解释与增强对抗性转移

通过对抗扰动内部的交互作用来解释和提高对抗性可传递性，并发现和证明了对抗性可传递性与对抗扰动内部交互作用之间的负相关关系。

Oct, 2020

分类器对于对抗扰动的鲁棒性分析

本论文分析了深层网络的一个有趣现象，即它们对于对抗性扰动的不稳定性，并提出了一个分析分类器鲁棒性的理论框架，并且为对抗性扰动的鲁棒性建立了一个上限。具体而言，我们建立了分类器对于对抗性扰动的鲁棒性的一个通用上限并用一些线性和二次分类器的例子说明了所获得的上限。我们的结果表明，在涉及小区分能力的任务中，所有选定的分类器将不会对于对抗性扰动产生鲁棒性，即使达到了较高的准确率。

Feb, 2015

加强对抗性容错性评估的置信度

该研究提出了一种测试方法以识别弱攻击和防御评估，为了增强透明和信心，将攻击单元测试作为未来强度评估的重要组成部分。

Jun, 2022

神经网络鲁棒性解释和评估

该研究提出了一种定量指标来评估神经网络模型的内在稳健性，并通过损失可视化的方式解释了对抗攻击和防御机制。该指标具有快速生成、结构和参数规模无关、可靠性高的优点，并提供了一种相对于不同测试设置不变的评估方法。

May, 2019

超越针对单一攻击类型的鲁棒性定位文件

当前关于对抗样本的防御研究主要集中在实现对单一攻击类型的健壮性，然而，可能的扰动空间更广泛，目前无法由单一攻击类型建模。当前防御方法的关注点与攻击空间的差异性引发了对现有防御方法的可行性和评估的可靠性的质疑。在本立场论文中，我们主张研究界应该超越单一攻击健壮性，并着重介绍三个潜在方向，包括：多同时攻击健壮性、未知攻击健壮性以及我们所定义的连续自适应健壮性问题。我们提供了一个统一的框架，严格定义了这些问题设置，综合了这些领域的现有研究，并概述了开放性研究方向。我们希望我们的立场论文能够激发出更多关于多同时攻击、未知攻击和连续自适应健壮性的研究。

May, 2024

RobArch：设计抗击恶意攻击的稳健架构

本研究通过对 DNN 体系结构组件进行大规模系统研究，提炼出 18 个可操作的鲁棒网络设计准则，构建了一系列在参数容量上对抗攻击稳健的模型家族，并介绍了新型 Robust Architecture (RobArch) 模型的应用。通过我们的实验，RobArch 在 RobustBench ImageNet 排行榜上的 AutoAttack 准确性达到了新的 state-of-the-art。

Jan, 2023