May, 2022

l-Leaks: 带有 Logits 的成员推断攻击

TL;DR本文提出基于黑盒目标模型的攻击方法,称为 L-Leaks 攻击,通过学习目标模型的对数几率并让暗模型更加与目标模型相似来构建一个针对目标的暗模型,进而实现预测目标样本成员身份的目的,实验证明攻击非常有效。