ICMLJul, 2020

仅标签成员推断攻击

TL;DR本文介绍了一种基于标签的会员推理攻击方法,通过对模型预测标签进行扰动来获取精细的成员信号,该攻击未被置换机密度分数的防御措施所挫败,仅采用差分隐私和(强)L2 正则化等防御策略才能有效地抵御所有攻击。