Dec, 2022

贝叶斯学习结合信息增益可靠地限制对抗性风险

TL;DR本文提出了一种新算法来训练深度神经网络模型以抵御对抗攻击,并提出防止模式崩溃以更好地逼近多模式贝叶斯模型的后验分布的方法。其提出的信息增益目标证明了该算法可以使其在抗对抗风险逼近常规经验风险,并且证明了其在CIFAR-10和STL-10数据集上比现有算法实现了更高的鲁棒性30%。