Feb, 2020

评估蒙特卡罗和蒸馏方法对深度贝叶斯神经网络分类的对抗鲁棒性

TL;DR本文考虑在Markov chain Monte Carlo(MCMC)和Bayesian Dark Knowledge(BDK)推断近似下评估深度神经网络模型对于对抗攻击的抵抗力的问题,并且比较了全MCMC推断和BDK对于快速梯度符号方法(FGSM)和投影梯度下降(PGD)两类对抗攻击的鲁棒性。结果表明,全MCMC推断具有出色的鲁棒性,显著优于标准点估计学习,而BDK提供了较小的提升,此外,我们还提出了一种存储效率高的方法,用于使用FGSM和PGD攻击计算大型蒙特卡罗集合的对抗性示例。