对抗性鲁棒性的利弊

Dec, 2023

The Pros and Cons of Adversarial Robustness

Yacine Izza, Joao Marques-Silva

TL;DR该论文揭示了现有鲁棒性定义以及鲁棒性认证方法的一些局限性，并调查了除了与鲁棒性相关的对抗性例子之外的其他用途。

Abstract

robustness is widely regarded as a fundamental problem in the analysis of machine learning (ML) models. Most often robustness equates with

robustness machine learning adversarial examples neural networks certification

发现论文，激发创造

机器学习鲁棒性：入门指南

本章探索了机器学习（ML）中鲁棒性的基本概念及其在建立可信人工智能（AI）系统中的关键作用。讨论从详细定义鲁棒性开始，描绘了 ML 模型在各种意外环境条件下保持稳定性能的能力。通过不同视角剖析 ML 鲁棒性：与泛化能力的互补性，作为可信 AI 的要求，对抗性与非对抗性方面，定量评价指标，以及可重复性和可解释性等指标。本章深入探讨了影响鲁棒性的因素，如数据偏差、模型复杂性和不规范的 ML 流程的陷阱。从广泛的角度调查了鲁棒性评估的关键技术，包括对抗性攻击，包括数字和物理领域。它还涵盖了非对抗性数据转移和深度学习（DL）软件测试方法的细微差别。讨论进一步探索了增强鲁棒性的改进策略，从以数据为中心的方法如去偏和增强开始。进一步的研究包括各种以模型为中心的方法，如迁移学习、对抗训练和随机平滑等。最后，讨论了训练后方法，包括集成技术，修剪和模型修复，作为提高模型对不可预测因素的适应性的经济有效策略。本章强调现有方法对 ML 鲁棒性的估计和实现所面临的挑战和局限性，并为未来关于这一关键概念的研究提供了洞见和方向，作为可信 AI 系统的先决条件。

Apr, 2024

深度学习模型的整体对抗鲁棒性

该研究论文综述了深度学习模型对抗鲁棒性的研究主题和基本原则，包括攻击、防御、验证和新应用。

Feb, 2022

对抗性样本的（不）可避免性

该研究提出了一个确定深度学习模型标签更改是否合理的框架，并且定义了一个自适应的鲁棒性损失，使用导出的经验公式，开发了相应的数据增强框架和评估方法，证明了其对确定性标签下的一阶最近邻分类的维持一致性，并提供了实证评估结果。

Jun, 2021

对抗鲁棒学习理论基础

本文提出了一种学习算法，旨在解决对抗性示例对机器学习模型的攻击，并尝试通过设计新的算法和理论分析来提高其鲁棒性和性能。

Jun, 2023

准确性和鲁棒性是否相关？

通过利用深度卷积神经网络生成对抗性样本，然后比较不同的生成技术在产生图像质量和测试机器学习模型鲁棒性方面的差异，最后在跨模型对抗迁移上进行了大规模实验，研究结果表明对抗性样本在相似的网络拓扑间是可传递的，并且更好的机器学习模型更不容易受到对抗性样本的攻击。

Oct, 2016

鲁棒性可能与准确性相矛盾

我们证明了，追求对抗鲁棒性和标准泛化之间存在固有的紧张关系，训练鲁棒性模型不仅可能更加费时，也会导致标准准确性的降低，并且这种现象是由于鲁棒分类器学习了根本不同的特征表示方法。

May, 2018

公平性增加对抗性漏洞性

本篇论文研究了深度学习模型在公平性和鲁棒性交叉应用中面临的挑战，并探讨了取得公平性如何降低模型对抗采样的鲁棒性的现象。作者提出了一种简单而有效的解决方案来平衡公平性和鲁棒性之间的权衡关系。

Nov, 2022

无需强鲁棒机器学习来管理对抗攻击风险

本文综述了关于机器学习鲁棒性的现状，并探讨了对抗性攻击的实际威胁以及如何管理这些风险，指出许多情况下不需要在模型的准确性和鲁棒性之间做出抉择。

Jun, 2023

对抗鲁棒性泛化需要更多数据

本文研究在简单自然数据模型中，对抗鲁棒学习的样本复杂度可以显著大于标准学习，这个差距是信息理论的，且与训练算法或模型家族无关。作者做了一些实验来证实这个结果。我们可以假设训练鲁棒分类器的困难，至少部分来自这种固有的更大的样本复杂度。

Apr, 2018

面向对抗攻击具有抵抗能力的深度学习模型

通过稳健优化方法探究神经网络对抗攻击的鲁棒性，设计出对抗攻击和训练模型的可靠方法，提出对于一阶对手的安全保证，并得到针对广泛对抗攻击的高鲁棒性网络模型。

Jun, 2017