度量学习用于对抗性鲁棒性

Sep, 2019

Metric Learning for Adversarial Robustness

Chengzhi Mao, Ziyuan Zhong, Junfeng Yang, Carl Vondrick, Baishakhi Ray

TL;DR通过对 PGD 攻击下的深度表示的实证分析，我们发现攻击会导致内部表示向 “误分类” 类别移动。基于此观察，我们提出了使用度量学习来规范攻击下的表示空间，从而产生更强健的分类器。通过精心抽样度量学习实例，我们的学习表示不仅提高了鲁棒性，还可以检测先前未见过的对抗性样本。量化实验表明，相对于以前的工作，我们的方法使得鲁棒性准确度提高了 4％，检测效率提高了 6％。

Abstract

deep networks are well-known to be fragile to adversarial attacks. We conduct an empirical analysis of deep representations under the state-of-the-art attack method called →

deep networks adversarial attacks pgd metric learning robust classifiers

发现论文，激发创造

采用深度度量学习改进对抗鲁棒性，提高对敏感性与不变性攻击的防御能力

利用度量学习将对抗正则化框架建模为最优传输问题，可以提高模型对不变扰动和敏感性攻击的防御，从而在对抗样本防御方面具有普遍适用性。

Nov, 2022

加强深度度量学习的对抗鲁棒性

本文提出了一种基于 Hardness Manipulation 和 Gradual Adversary 的深度度量学习模型的对抗鲁棒性方法，并通过实验证明其在鲁棒性、训练效率和性能方面均优于现有防御方案。

Mar, 2022

批量检测对抗性示例 -- 一种几何方法

本文研究通过引入几何度量法来检测深度学习模型中的对抗样本，并以 MNIST 数据集和两个医学数据集为例，对密度和覆盖度两种几何度量法进行了实证研究，结果表明这两种度量法能够检测到对抗样本并能在机器学习系统中使用来监控可能的对抗性例子或相关病理因素，为进一步研究机器学习系统的安全提供了基础。

Jun, 2022

防御物理可行的图像分类攻击

本篇研究论文主要探讨了如何有效防御基于图像分类的深度神经网络攻击。通过研究两种最常见的防御方法，我们发现这些方法对于三种最高危物理攻击的防御效果较差。因此我们提出了一种新的抽象对抗模型，矩形遮挡攻击，并且开发了两种计算结果的对抗样本的方法。最后，我们通过新的模型进行对抗训练，证明了这一方法是一种高效的通用防御策略。

Sep, 2019

对抗鲁棒性泛化需要更多数据

本文研究在简单自然数据模型中，对抗鲁棒学习的样本复杂度可以显著大于标准学习，这个差距是信息理论的，且与训练算法或模型家族无关。作者做了一些实验来证实这个结果。我们可以假设训练鲁棒分类器的困难，至少部分来自这种固有的更大的样本复杂度。

Apr, 2018

对抗性样本的（不）可避免性

该研究提出了一个确定深度学习模型标签更改是否合理的框架，并且定义了一个自适应的鲁棒性损失，使用导出的经验公式，开发了相应的数据增强框架和评估方法，证明了其对确定性标签下的一阶最近邻分类的维持一致性，并提供了实证评估结果。

Jun, 2021

密度自适应的深度度量学习

本论文提出将数据的密度测量集成到 DML 的优化框架中，以在端到端的训练过程中自适应平衡类间相似性和类内变异性，通过在三种嵌入方式上增加密度适应性，不断地在三个公共数据集上展示清晰的改善。

Sep, 2019

通过数据集随机化中和对抗性攻击

本文通过使用超空间投影来提出了一种新的针对图像分类器的通用防御机制，可以提高深度学习模型对抗攻击的鲁棒性，实验结果显示通过优化攻击和生成对抗攻击测试其在 MNIST 数据集上的成功率可以至少减少 89% 和 78%。

Jun, 2023

神经网络鲁棒性解释和评估

该研究提出了一种定量指标来评估神经网络模型的内在稳健性，并通过损失可视化的方式解释了对抗攻击和防御机制。该指标具有快速生成、结构和参数规模无关、可靠性高的优点，并提供了一种相对于不同测试设置不变的评估方法。

May, 2019

元学习对图神经网络的对抗攻击

通过使用元梯度将图形视为超参数进行优化，我们研究了对节点分类的图神经网络进行训练时间攻击，发现即使对无监督嵌入也会出现性能下降，甚至会产生误导效应。

Feb, 2019