Feb, 2021

基于可验证对抗性鲁棒性的贝叶斯推断

TL;DR通过贝叶斯学习的视角考虑深度神经网络的对抗训练,并提出了一种具有可证明保证的贝叶斯神经网络(BNN)的对抗训练的原则性框架。该方法可在MNIST、FashionMNIST和CIFAR-10上训练出可证明鲁棒性的模型,并用于不确定性校准。这是第一次直接训练可证明的BNN,可促进在安全关键应用中的部署。