Jul, 2023

基于分位数回归的可扩展成员推断攻击

TL;DR成员推断攻击是为了确定一个特定的示例是否被用于训练,采用黑盒访问已训练模型。我们引入了一种新类型的攻击,基于对在训练中未使用的数据上由被攻击模型诱导的置信分数的分位回归。我们通过大量的实验展示了该方法在各种数据集和模型架构上的有效性。