May, 2022

通过对抗鲁棒性评估成员推断

TL;DR本文提出了一种基于对抗鲁棒性的增强成员推断攻击方法,通过标签平滑调整对抗性扰动的方向,在白盒设置下对 Fashion-MNIST、CIFAR-10 和 CIFAR-100 三种数据集进行了实验,结果表明该方法的性能优于现有的基于对抗性鲁棒性的方法,且在攻击对抗性训练模型方面,更胜一筹。