May, 2020

隶属推断攻击的难度

TL;DR该论文研究深度学习中的成员推理攻击,指出现有攻击方法的报告中存在高误报率(FAR)和针对误分样本的较弱识别能力,并探索了距离决策边界和梯度范数等新特征,证明其对误分类样本分类能力普遍一般,最后通过多项实验证明了现有的MI攻击较难同时实现高准确率和低FAR。