关注隐藏者：探索加强对抗训练的隐藏威胁

Dec, 2023

关注隐藏者：探索加强对抗训练的隐藏威胁

Focus on Hiders: Exploring Hidden Threats for Enhancing Adversarial Training

Qian Li, Yuxiao Hu, Yinpeng Dong, Dongxiao Zhang, Yuntian Chen

TL;DR通过重新思考和重新定义对抗性训练的最小最大优化问题，我们提出了一种称为 HFAT 的广义对抗性训练算法。HFAT 引入了迭代演化优化策略来简化优化问题，并采用了辅助模型来揭示隐藏者，有效地结合了标准对抗性训练和隐藏者的优化方向。此外，我们还介绍了一种自适应加权机制，可以在不同的训练阶段帮助模型在对抗性示例和隐藏者之间适应地调整其关注点。我们通过大量的实验证明了我们方法的有效性，并确保 HFAT 具有更高的鲁棒性和准确性。

Abstract

adversarial training is often formulated as a min-max problem, however, concentrating only on the worst adversarial examples causes alternating repetitive confusion of the model, i.e., previously defended or corr

adversarial training min-max problem hiders robustness accuracy

发现论文，激发创造

不致死的攻击使对抗学习更强大

本研究提出了友好对抗训练 (FAT) 的新方法，其中通过提前停止最严格的对抗数据搜索算法，即早停止的 PGD，来最小化损失并利用自信的对抗数据更新当前模型，理论上可以通过对抗风险的上限来证明，实验证明不需要以自然泛化为代价也可以实现对抗强度。

Feb, 2020

提高鲁棒公平性的困难对抗样本挖掘

通过自适应的困难对抗样本挖掘，HAM 提出一种直接而有效的方法来改进深度神经网络对于对抗性例子的鲁棒性和公平性，减少计算成本。

Aug, 2023

通过最小值最大化优化实现的敌对攻击生成

本文利用多域最小最大优化的一般性框架，推进了不同类型的对抗性攻击设计，并展示了该统一框架在攻击目标函数，抵御多输入下的统一扰动，生成攻击和数据变换下的对抗攻击等方面的优异性能和整体性工具的作用。

Jun, 2019

走向公平感知的对抗学习

在这篇论文中，我们提出了一种名为公平感知对抗学习（FAAL）的新的学习范式，通过将鲁棒训练问题重新定义为最小 - 最大 - 最大框架，以确保训练模型的鲁棒性和公平性。具体而言，通过利用分布鲁棒优化，我们的方法旨在在不同类别之间找到最差的分布，解决方法保证了高概率的上界性能。FAAL 可以在仅两个迭代周期内将一个不公平的鲁棒模型调整为公平模型，而不牺牲整体准确性和鲁棒性，实验证明了 FAAL 相对于其他先进方法的卓越性能和高效性。

Feb, 2024

∞范数的健壮性与更多因素：高效对抗训练技术的实现

本篇论文阐述了对于神经网络存在攻击的情况下，如何通过对抗训练和小样本训练方法，提高模型的鲁棒性。

Dec, 2021

加强深度度量学习的对抗鲁棒性

本文提出了一种基于 Hardness Manipulation 和 Gradual Adversary 的深度度量学习模型的对抗鲁棒性方法，并通过实验证明其在鲁棒性、训练效率和性能方面均优于现有防御方案。

Mar, 2022

对抗特征对齐：通过对抗训练在深度学习中平衡鲁棒性和准确性

本文提出了一种名为 Adversarial Feature Alignment (AFA) 的新型对抗性训练方法，旨在解决深度学习模型在安全性上平衡鲁棒性和准确性的挑战。通过利用对比学习的优化算法，AFA 减轻特征不对齐可能导致误分类的风险，并在实验中展示了其卓越性能。

Feb, 2024

对抗性样本是否平等？一种可学习的加权极小最大风险方法，用于对非均匀攻击进行鲁棒性保护

本文提出一种基于加权最小化风险优化方法的防御策略，通过优先考虑更易受攻击的样本，可以在不均衡攻击下实现防御，并通过实验证明了该模型在非均衡攻击下取得了明显的改进，而在均衡攻击下平均正确率并未显著下降。

Oct, 2020

用特征可分性提高对抗训练

本篇论文旨在探究防御对抗攻击的神经网络算法，在研究中发现传统的对抗训练没有学习到更好的特征表示方法，同时也存在过度拟合和泛化性能差的问题。为解决这些问题，引入了对抗训练图（ATG）的概念，提出基于 ATG 的对抗训练与特征可分性（ATFS）的新框架，该框架能够提高特征的内部类相似性并增加类间特征方差，从而明显提高了算法的性能。

May, 2022

探究快速对抗性训练

本文通过实验研究快速对抗训练的行为并显示其成功的关键在于从过度拟合弱攻击中恢复。我们进一步扩展了这一发现以改善快速对抗训练，展示了与强对抗训练相比更优异的鲁棒性准确性以及更短的训练时间。

Jun, 2020