通过自适应逐实例损失平滑提升对抗训练

Mar, 2023

通过自适应逐实例损失平滑提升对抗训练

Improved Adversarial Training Through Adaptive Instance-wise Loss Smoothing

Lin Li, Michael Spratling

TL;DR通过对输入进行敌对扰动（即人类感知不到的人工噪音），深度神经网络容易产生错误预测。迄今为止，敌对训练已成为对抗性攻击最成功的防御方式。本文聚焦于改进敌对训练以提高对抗性强度，提出了一种新的敌对训练方法 ISEAT，它通过自适应、实例特定的方式同时平滑输入和权重损失景观以增强鲁棒性，证明与现有防御方法相比，该方法具有显著的优越性。

Abstract

Deep neural networks can be easily fooled into making incorrect predictions through corruption of the input by adversarial perturbations: human-imperceptible artificial noise. So far adversarial training has been

adversarial perturbations adversarial training adversarial vulnerability robustness instance-adaptive smoothness enhanced adversarial training

发现论文，激发创造

实例自适应对抗训练：神经网络中更好的准确性和权衡

本文提出了一种实例自适应对抗训练技术，通过在每个训练样本周围施加特定的扰动边缘来实现更好的泛化能力和测试准确性。

Oct, 2019

几何感知实例再加权对抗训练

这篇研究论文介绍了一种新的对抗训练方法，通过根据自然数据点到分类边界的远近来赋予不同的权重，以提高模型的鲁棒性和准确性。

Oct, 2020

针对对抗训练的漏洞感知实例加权

通过实验，我们提出了一种新的基于实例的重加权方案，其考虑每个自然样本的易受攻击性和由对抗攻击导致的其对应的丢失信息，这对现有的加权方案表现有着显著提高，特别是对抗强白箱和黑箱攻击。

Jul, 2023

攻击对抗性攻击作为一种防御

通过对敌对学习及攻击的深入探究，我们发现在敌对性训练的模型中，用微小的随机噪声扰动部分攻击样本能够破坏其误导性预测，为此我们提出了一种有效的防御方法，是通过制造更加有效的防御扰动方法，利用敌对训练降低了地面真实的局部 Lipschitzness，同时攻击所有类别，将误导的预测转换为正确的预测，这种方法在经验实验证明有效。

Jun, 2021

自组合对抗训练提高鲁棒性

本文提出了一种简单而强大的自我整合对抗训练方法 (SEAT)，通过在训练数据池中加入对抗样本来提高目标模型的鲁棒性，并通过历史模型的权重平均值产生一个健壮的分类器，该方法比起其他防御策略在各种对抗攻击下提高了很多的鲁棒性

Mar, 2022

∞范数的健壮性与更多因素：高效对抗训练技术的实现

本篇论文阐述了对于神经网络存在攻击的情况下，如何通过对抗训练和小样本训练方法，提高模型的鲁棒性。

Dec, 2021

提高神经网络的对抗鲁棒性的增量余量对抗训练 (IMA)

提出一种新的对抗性训练方法，称为增量边界对抗训练 (Increasing-Margin Adversarial Training)，该方法通过生成最佳对抗性训练样本来提高鲁棒性，同时保持准确性，在医学图像分类和分割应用中实现了准确性和鲁棒性的平衡。

May, 2020

通过对抗训练平滑分类器实现可证明健壮的深度学习

本文提出使用对抗训练来提高基于随机平滑的分类器的效果，并设计一种适应平滑分类器的攻击方法，通过大量实验，得出这种方法在 ImageNet 和 CIFAR-10 上的性能显著胜过所有现有的可证明的 L2 - 强健分类器，证明了这种方法是可靠的，且半监督学习和预训练能够进一步提高其效果。

Jun, 2019

对抗训练的规范不可知鲁棒性

本文研究对抗样本攻击机器学习模型并提出一种新的攻击方法，证明最先进的对抗训练方法无法同时获得对 $\ell_2$ 和 $\ell_\infty$ 范数的健壮性，提出可能的解决方案及其局限性。

May, 2019

通过反向平滑实现高效稳健训练

本研究提出了一种新的初始化策略通过随机平滑过程实现单步的快速对抗训练，相较于原来的算法具有更好的稳定性和模型鲁棒性。实验结果表明，该方法可以在更短的训练时间内实现类似 TRADES 方法的模型稳健性。

Oct, 2020