Feb, 2024

在连续学习中维持对抗性鲁棒性

TL;DR机器学习系统的安全性和可靠性需要对抗鲁棒性。然而,由于神经网络在学习新任务时容易忘记先前的对抗鲁棒性,复杂的防御算法所获得的对抗鲁棒性很容易被抹去。为了解决这个问题,我们提出了一种名为 “双梯度投影” 的方法,通过将权重更新的梯度正交投影到两个关键子空间上,实现连续鲁棒学习,这两个子空间一个用于稳定平滑的样本梯度,另一个用于稳定神经网络的最终输出。四个基准测试的实验结果表明,我们提出的方法有效地保持了连续鲁棒性,对抗强对抗攻击的效果优于结合现有防御策略和连续学习方法的基准线组成的方法。