Jul, 2022

贝叶斯神经网络对抗攻击的鲁棒性研究

TL;DR本文旨在分析大数据下拟贝叶斯神经网络(Bayesian Neural Networks)对抗性攻击(Adversarial Attack)的几何特征,证明当数据分布存在退化时,对抗性攻击的易感性增加,并证明拟贝叶斯神经网络后验概率分布的期望梯度为零,因此在MNIST、Fashion MNIST和半月形数据集上,拟贝叶斯神经网络可展现出对于基于梯度和基于无梯度攻击的同时鲁棒性和高准确率。