环境-固有维度差对对抗漏洞的影响

Mar, 2024

环境-固有维度差对对抗漏洞的影响

Effect of Ambient-Intrinsic Dimension Gap on Adversarial Vulnerability

Rajdeep Haldar, Yue Xing, Qifan Song

TL;DR我们提出了两种对抗性攻击的概念：一个是可感知的攻击，另一个是不可感知的攻击，并且通过证明维度差对模型的鲁棒性和攻击强度有明确的联系。

Abstract

The existence of adversarial attacks on machine learning models imperceptible to a human is still quite a mystery from a theoretical perspective. In this work, we introduce two notions of →

发现论文，激发创造

利用对抗性训练产生的模型置信度来增强对抗性鲁棒性

研究使用通过对抗训练引入的置信度信息来增强给定对抗性训练模型的对抗鲁棒性及提出基于置信度信息和最近邻搜索的 Highly Confident Near Neighbor（HCNN）框架，以加强基本模型的对抗鲁棒性，并进行详细的实证研究。

Nov, 2017

对抗球体

研究表明，计算机视觉模型容易受到输入微小对抗扰动攻击，而该现象是由数据流形的高维几何性质引起的，结果表明神经网络的易受小型对抗性扰动攻击是测试误差的逻辑结果。

Jan, 2018

局部内在维度对特征对抗样本子空间描述的限制

本文研究了使用局部内在维数来刻画深度神经网络对抗性样本的子空间，针对存在的局限性作了实验验证，结果表明LID能力有限。

Mar, 2018

对抗样本的几何性质

该研究提出了一种基于几何框架和流形重建方法的方法，以分析对抗样本的高维几何形状，并证明了不同规范的鲁棒性、球形对抗性训练的样本编号和最近邻分类器与基于球面的对抗训练的充分采样条件。

Nov, 2018

拆分对抗鲁棒性与泛化

为了解决网络鲁棒性和泛化性之间的矛盾问题，研究通过对数据流形的研究证明对流形上对抗性样本的限制可以提高模型泛化能力且鲁棒性和泛化性并不矛盾。

Dec, 2018

双流形对抗性鲁棒性: 抵御Lp和非Lp对抗攻击

通过在图像的潜在空间中对对抗样本进行对抗训练以及利用生成模型中学习到的流形信息进行双流形对抗训练，可以大大提高深度学习模型的鲁棒性，从而有效地应对多种新颖的对抗攻击。

Sep, 2020

流形上的投影梯度下降算法

本文提供了一种可计算、直接且数学严谨的方法，用于近似高维数据的类流形的微分几何，以及从输入空间到这些类流形的非线性投影。该方法应用于神经网络图像分类器的设置中，在流形上生成新颖的数据样本，并实现了流形上的对抗训练的投影梯度下降算法，以解决神经网络对对抗性攻击的敏感性问题。

Aug, 2023

用对抗方法估计拓扑维度的谐波评分图

利用对得分映射的固定点 insight，通过利用对应的狄利克雷能量进行正则化将其前提条件确认为对潜在 manifold 学习的拓扑维度进行回归是可能的，然后引入了一种使用对抗性攻击来测量学习的 manifold 的拓扑维度的新方法，从而产生对学习的 manifold 的有用解释。

Dec, 2023

对抗训练的高维模型：几何与权衡

在高维度背景下，研究基于边界的线性分类器中的对抗性训练，提出了一个可以研究数据和对手几何结构相互作用的可行数学模型，精确描述了足够统计量的敌对经验风险最小化，揭示了存在可以在不损失准确性的情况下进行防御的方向，并且证明了防御非鲁棒特征在训练中的优势，作为一种有效的防御机制。

Feb, 2024

机器学习中的对抗性脆弱性的几何框架

使用数学方法理解人工神经网络中的易受攻击性，并提出新的工具和理论框架，探索神经网络学习的空间和几何信息的应用。

Jul, 2024