深度对抗防御多级-Lp攻击
本文提出使用模态连通性来研究深度神经网络的对抗鲁棒性,并提供了提高对抗鲁棒性的新方法。实验结果表明,使用少量的真实数据学习到的路径连接可以有效地减轻对抗攻击的影响,同时在干净数据上保持原有的准确性。同时,该研究还使用模态连通性来对比分析正常模型和鲁棒模型的损失,在对抗鲁棒性损失的路径上存在壁垒,该损失与输入 Hessian 矩阵的最大特征值之间存在高度相关性。
Apr, 2020
本篇研究通过分类对抗性攻击和防御方法,提出三类半定界数理优化问题,即对抗(再)训练、正则化方法和认证防御,并调查了最近的研究成果和挑战以及展望未来的发展。
Jul, 2020
本文提出了一种基于几何特性的极值范数对抗训练(E-AT)方法,不同于其他方法的是,它有效地提供了一种多范数的鲁棒性,且其训练时间仅为其他多范数对抗训练方法的三分之一,E-AT方法在ImageNet的单个epoch和CIFAR-10的三个epoch的训练下,只需要一种$l_p$对抗模型就可以将其传播到多种$l_p$威胁模型并显著提高多个$l_p$鲁棒模型在CIFAR-10上的最新技术水平。
May, 2021
本文综述了近期深度学习中对于对抗攻击和防御技术的研究进展,聚焦于基于深度神经网络的分类模型,并进行了对攻击和防御方法的分类和评价,其中重点介绍了正则化方法在提高模型的鲁棒性方面的应用。此外,还探索了新型攻击方式,如基于搜索、决策、降维和物理世界攻击,并提出了对于未来研究的建议。
Mar, 2023
提出了一种新的强鲁棒性深度神经网络设计方法,称为Robust Mode Connectivity(RMC),通过人群学习技术搜索预训练的神经网络结构,以提高神经网络对多种样本攻击的鲁棒性。
Mar, 2023
通过分析正常和对抗攻击样本的深度神经网络表示之间的差异,研究了对抗攻击的鲁棒性和现有防御机制的普适性,并揭示了L2和Linfinity范数之间的显著差异。
Aug, 2023
在这项研究中,我们提出了一个新的l0范数攻击方法,称为sigma-zero,该方法利用了l0范数的一种特殊的可微近似来优化梯度,以及一个自适应的投影算子来动态调整损失最小化和扰动稀疏性之间的权衡。通过对MNIST、CIFAR10和ImageNet数据集进行广泛评估,包括稳健和非稳健模型,在不需要耗时的超参数调整的情况下,sigma-zero发现了最小的l0范数对抗性示例,且在成功率、扰动大小和可扩展性方面优于所有其他竞争的稀疏攻击。
Feb, 2024