利用深层模型的分层内在维度进行实用对抗训练

May, 2024

利用深层模型的分层内在维度进行实用对抗训练

Exploiting the Layered Intrinsic Dimensionality of Deep Models for Practical Adversarial Training

Enes Altinisik, Safa Messaoud, Husrev Taha Sencar, Hassan Sajjad, Sanjay Chawla

TL;DR通过改进的 Adversarial Training 算法 SMAAT，本研究提供了 vision 和 language 模型在 generalization 和 robustness 趋势差异的首个解释，同时展示了 SMAAT 在多个任务中显著提高了鲁棒性，且相比于标准的 AT 仅需约 25-33% 的 GPU 时间。

Abstract

Despite being a heavily researched topic, adversarial training (AT) is rarely, if ever, deployed in practical AI systems for two primary reasons: (i) the gained robustness is frequently accompanied by a drop in <

adversarial training smaat robustness generalization intrinsic dimension

发现论文，激发创造

深度状态空间模型的对抗鲁棒性探索

深度状态空间模型（SSMs）面临着真实世界部署中的对抗性扰动（APs）所带来的严重安全挑战。本研究评估了 SSMs 的不同结构变种在对抗训练（AT）中的对抗鲁棒性（AR）表现，并发现引入注意力机制对于 SSMs 在 AT 中具有更好的稳健性和泛化性之间的权衡，并提出了一种简单而有效的自适应缩放（AdS）机制以解决引入 RO 问题的困境。

Jun, 2024

光谱视角理解和提高对抗鲁棒性

本研究从频谱的角度探讨对抗性训练机制（AT），展示在低频区保留偏向形状的表示能够提高深度神经网络（DNNs）的鲁棒性，并提出了一种名称为 “频谱对齐正则化”（SAR）的训练方法，在多个数据集和攻击下显著提高 DNNs 的鲁棒准确性。

Jun, 2023

增强扩散以提高强健性泛化能力

本文提出了一种名为 Diffusion Enhanced Adversarial Training (DEAT) 的新方法，以改善 Adversarial Training 中的 generalization 问题，理论上证明了 DEAT 比主要 AT 框架 ——Projected Gradient Descent Adversarial Training (PGD-AT) 更紧密的泛化界限，并通过广泛的实证调查证实了 DEAT 的优越性。

Jun, 2023

医学图像分类上的动态扰动自适应对抗训练

提出了一种动态扰动自适应对抗训练（DPAAT）方法，通过将对抗训练放置在动态学习环境中，生成自适应的数据级扰动，并通过损失信息收集提供动态更新的准则，从而在提高鲁棒性的同时保留高泛化能力。在皮肤科 HAM10000 数据集上进行全面测试，表明 DPAAT 不仅实现了更好的鲁棒性改善和泛化性能保留，还显著提高了各种 CNNs 的平均精度和解释能力，表现出作为通用医学影像分类中的一种潜在的强大的对抗训练方法。

Mar, 2024

提高鲁棒公平性的困难对抗样本挖掘

通过自适应的困难对抗样本挖掘，HAM 提出一种直接而有效的方法来改进深度神经网络对于对抗性例子的鲁棒性和公平性，减少计算成本。

Aug, 2023

利用超球嵌入提升对抗训练

本文提出将超球体嵌入机制融入对抗训练过程中，通过在紧凑流形上对特征进行规则化，将表示学习的强度融合到轻量 yet 有效的模块中，该方法可从多个方面提高对抗性训练模型的鲁棒性，并验证了在多种攻击下使用超球体嵌入表示方法可以在减少额外计算的情况下提升每个对抗训练框架的模型鲁棒性。

Feb, 2020

AROID：通过在线逐实例数据增强提高对抗鲁棒性

该论文提出了一种新的方法，通过在线实例化学习数据增强策略来提高 Deep neural networks 的 Adversarial training 的鲁棒性，在多个模型结构和数据集上成功地超越了现有的竞争性数据增强方法。

Jun, 2023

SAT: 基于课程的损失平滑改进对抗训练

本文提出了一种平滑对抗训练方法 (SAT)，它利用课程学习的思想对对抗训练过程进行平滑处理，提高了对抗训练的稳定性并在干净精度与鲁棒性之间实现了更好的权衡，具体方法基于海森矩阵的特征值以及 softmax 概率，实验结果显示该方法在 CIFAR-100 和 Imagenette 数据集上比 AT 方法显著提升了干净度与鲁棒度。

Mar, 2020

通过局部和全局潜在分布提高模型的鲁棒性

通过全局流形的视角考虑深度神经网络对抗攻击的模型鲁棒性问题，提出了一种新的对抗训练方法 ATLD，该方法在不受监督的情况下，利用了本地和全局潜在信息，通过对抗游戏生成潜在流形对抗性实例，保留了流形的局部和全局信息，具有良好的鲁棒性，实验结果表明该方法在多个数据集上显著优于现有技术。

Jul, 2021

A2: 高效自动化攻击者用于提升对抗训练

本文提出了一个名为 A2 的高效自动攻击者，它能够在训练过程中实时生成最优扰动，并证实其强制扰动能够有效提高不同数据集上各种对抗训练方法的鲁棒性。

Oct, 2022