在连续学习中维持对抗性鲁棒性

Feb, 2024

Maintaining Adversarial Robustness in Continuous Learning

Xiaolei Ru, Xiaowei Cao, Zijia Liu, Jack Murdoch Moore, Xin-Ya Zhang...

TL;DR机器学习系统的安全性和可靠性需要对抗鲁棒性。然而，由于神经网络在学习新任务时容易忘记先前的对抗鲁棒性，复杂的防御算法所获得的对抗鲁棒性很容易被抹去。为了解决这个问题，我们提出了一种名为 “双梯度投影” 的方法，通过将权重更新的梯度正交投影到两个关键子空间上，实现连续鲁棒学习，这两个子空间一个用于稳定平滑的样本梯度，另一个用于稳定神经网络的最终输出。四个基准测试的实验结果表明，我们提出的方法有效地保持了连续鲁棒性，对抗强对抗攻击的效果优于结合现有防御策略和连续学习方法的基准线组成的方法。

Abstract

adversarial robustness is essential for security and reliability of machine learning systems. However, the adversarial robustness gained by sophisticated →

adversarial robustness machine learning systems continual robust learning neural networks defense algorithms

发现论文，激发创造

对抗性鲁棒基于记忆的持续学习器

对记忆型持续学习算法的对抗鲁棒性进行研究，提出了一种新的对抗鲁棒记忆型持续学习方法，通过调整数据的逻辑值来减轻敌对样本导致的过去信息遗忘，并通过梯度选择机制克服有限存储数据导致的梯度混淆，实验结果表明该方法在对抗数据上取得高达 8.13% 的更高准确性。

Nov, 2023

朝向对抗鲁棒的持续学习

该研究针对深度学习在不断学习模型中容易受到对抗攻击的问题提出了 Task-Aware Boundary Augmentation (TABA) 的防御方法，并在 CIFAR-10 和 CIFAR-100 上进行了广泛的实验，证明了对抗训练和 TABA 在抵御对抗攻击方面的有效性。

Mar, 2023

关于强大而准确分类器的连续性

创建可靠的学习模型、了解对抗性示例现象、解释连续假设与其稳健性和准确性的不兼容性。

Sep, 2023

通过正则化对抗梯度实现神经网络的鲁棒训练

通过限制神经网络的对抗梯度并增加对抗性样本生成的难度，提高了神经网络的鲁棒性，使其能够抵御各种类型的对抗性攻击，特别是迁移攻击。

May, 2018

面向对抗攻击具有抵抗能力的深度学习模型

通过稳健优化方法探究神经网络对抗攻击的鲁棒性，设计出对抗攻击和训练模型的可靠方法，提出对于一阶对手的安全保证，并得到针对广泛对抗攻击的高鲁棒性网络模型。

Jun, 2017

深度学习模型的整体对抗鲁棒性

该研究论文综述了深度学习模型对抗鲁棒性的研究主题和基本原则，包括攻击、防御、验证和新应用。

Feb, 2022

神经网络鲁棒性的反馈学习

通过分析决策空间中的模型鲁棒性，提出一种反馈学习方法，以了解模型的学习情况，促进纠正缺陷的重新训练过程。根据一组基于距离的准则进行的评估表明，我们的方法可以显著提高模型的准确性和对各种逃逸攻击的鲁棒性，同时观察到跨类不平等的存在，并提出通过改变不同类别中生成的示例的比例来弥补它。

Sep, 2019

精准、可靠、快速的鲁棒性评估

在神经网络的研究中，我们开发了一种新的梯度基础的对抗攻击方法，相较于已有的攻击方法，它更可靠，可以适应广泛的对抗标准，并且在提高效率的同时，不需要进行超参数调整，这将对神经网络的鲁棒性评估做出有益的贡献。

Jul, 2019

鲁棒性一致的对抗训练用于安全机器学习模型更新

我们展示了机器学习模型的周期性更新可能导致负面翻转，进而影响模型的安全性和性能，为此我们提出了 robustness-congruent adversarial training 方法用于解决这个问题。实验证明，我们的方法可以有效降低负面翻转问题，提高模型的准确性和鲁棒性。

Feb, 2024

基于数据驱动的利普希茨连续性：提高对抗鲁棒性的成本有效方法

通过探究 Lipschitz 连续性的概念，该研究提出了一种理论基础和实用解决方案来确保深度神经网络的可靠性，以对抗敌对攻击，在输入中添加几乎不可察觉的扰动来误导网络。我们提出了一种新的算法，将输入域重新映射到受限范围内，减小 Lipschitz 常数，从而提高鲁棒性。与现有的反对抗性训练模型不同，我们的方法几乎没有成本，可以与现有模型集成而无需重新训练。实验结果表明，我们的方法的普适性，可以与各种模型结合，实现鲁棒性的增强。此外，我们的方法在 RobustBench 排行榜上为 CIFAR10、CIFAR100 和 ImageNet 数据集实现了最佳鲁棒准确度。

Jun, 2024