ICMLMay, 2024

拟合干扰攻击下的适应性推断的优点与挑战

TL;DR在安全关键应用领域如医学成像和自动驾驶中,维持高的对抗鲁棒性以保护免受潜在对抗攻击的影响,并进行可靠的不确定性量化对于决策至关重要。本研究通过使用合规性预测 (CP) 方法,探究了深度学习模型的不确定性,同时深入研究了合规性预测在对抗防御中的表现。通过理论分析和实证研究,在改进合规性预测效能方面,我们提出了一种通过在对抗训练中优化 Beta 权重损失并使用熵最小化正则化器的 Uncertainty-Reducing AT (AT-UR) 方法。