一种评估机器学习分类器对抗距离的实用方法

Sep, 2024

一种评估机器学习分类器对抗距离的实用方法

A practical approach to evaluating the adversarial distance for machine learning classifiers

Georg Siedel, Ekagra Gupta, Andrey Morozov

TL;DR本文探讨了机器学习分类器在面对对抗性输入时的稳健性评估问题，指出现有计算方法在复杂模型中存在挑战。通过采用迭代对抗攻击和认证方法，提出了一种更全面的评估对抗稳健性的新方式，并发现该方法能够提供更有价值的对抗距离估计，从而推动机器学习分类器的安全使用。

Abstract

Robustness is critical for Machine Learning (ML) classifiers to ensure consistent performance in real-world applications where models may encounter corrupted or adversarial inputs. In particular, assessing the robustness of classifiers to adversarial inputs is essential to protect syst

发现论文，激发创造

神经网络鲁棒性解释和评估

该研究提出了一种定量指标来评估神经网络模型的内在稳健性，并通过损失可视化的方式解释了对抗攻击和防御机制。该指标具有快速生成、结构和参数规模无关、可靠性高的优点，并提供了一种相对于不同测试设置不变的评估方法。

May, 2019

对抗鲁棒性评估：为什么L0和L∞攻击都是必要的

提出了一种双重质量评估法来评估深度神经网络算法的鲁棒性，分析了存在的问题，并揭示了当前网络和防御在各个鲁棒性级别上的脆弱性。

Jun, 2019

对抗鲁棒性基准测试

本研究旨在建立一个全面、严谨、连贯的标准来评估对抗性鲁棒性，通过两个鲁棒性曲线作为公正的评估标准来进行大规模实验，全面掌握攻击与防御方法的表现并得出重要结论和未来研究的启示。

Dec, 2019

使用Voronoi-Epsilon对抗者测量对抗鲁棒性

研究采用Voronoi-epsilon对抗者来构建对抗样本，平衡扰动的两个概念，以克服传统对抗准确性定义中准确性和对抗准确性之间的权衡，并证明在此对抗者上，最近邻分类器是对抗性最强的分类器之一。

May, 2020

稳健性分析解释的评估和方法

本文提出一种基于鲁棒性分析的特征解释新的评估标准，通过针对我们提出的评估标准进行优化，获得了松散且必要的解释和可以将当前预测移动到目标类的特征集。我们通过多领域实验和用户研究验证了我们评估标准和解释的有用性。

May, 2020

一个标准的对抗鲁棒性基准测试RobustBench

为了建立标准化的对抗性鲁棒性基准，我们考虑了图片分类任务，并引入了允许的模型限制，使用 AutoAttack 进行评估，同时提供80多种鲁棒模型的开源库，分析了鲁棒性对分布偏移、平滑性等性能的影响。

Oct, 2020

对现代无参考图像和视频质量度量的鲁棒性在对抗攻击下的比较

现如今基于神经网络的图像和视频质量度量表现出比传统方法更好的性能。然而，它们也变得更容易受到对抗攻击，这些攻击可以增加度量指标的分数，而无需改善视觉质量。现有的质量度量基准主要通过与主观质量的相关性和计算时间来比较性能。然而，图像质量度量的对抗鲁棒性也是一个值得研究的领域。本文分析了现代度量在不同对抗攻击下的鲁棒性，并对15种无参考图像/视频质量度量的攻击效果进行了比较。一些度量显示出很高的抵抗对抗攻击的能力，使得它们在基准测试中的使用比易受攻击的度量更加可靠。该基准测试接受研究人员提交新的度量方法，使得研究人员可以使自己的度量方法更加抵抗攻击，或者寻找适合自己需求的度量方法。可以通过 pip install robustness-benchmark 来使用我们的基准测试。

Oct, 2023

对抗性鲁棒性的利弊

该论文揭示了现有鲁棒性定义以及鲁棒性认证方法的一些局限性，并调查了除了与鲁棒性相关的对抗性例子之外的其他用途。

Dec, 2023

对抗训练的高维模型：几何与权衡

在高维度背景下，研究基于边界的线性分类器中的对抗性训练，提出了一个可以研究数据和对手几何结构相互作用的可行数学模型，精确描述了足够统计量的敌对经验风险最小化，揭示了存在可以在不损失准确性的情况下进行防御的方向，并且证明了防御非鲁棒特征在训练中的优势，作为一种有效的防御机制。

Feb, 2024

探索对抗前沿：通过对抗超体积量化健壮性

通过提出一种新的测量指标——对抗超体积（adversarial hypervolume），该研究验证了该指标对于揭示深度学习模型鲁棒性中微妙差异的有效性，为当前和未来的防御模型的韧性评估和基准制定提供了标准。

Mar, 2024