Mar, 2023

通过自适应逐实例损失平滑提升对抗训练

TL;DR通过对输入进行敌对扰动(即人类感知不到的人工噪音),深度神经网络容易产生错误预测。迄今为止,敌对训练已成为对抗性攻击最成功的防御方式。本文聚焦于改进敌对训练以提高对抗性强度,提出了一种新的敌对训练方法 ISEAT,它通过自适应、实例特定的方式同时平滑输入和权重损失景观以增强鲁棒性,证明与现有防御方法相比,该方法具有显著的优越性。