Feb, 2020

分类模型中的成员推断攻击和防御

TL;DR本研究通过系统分类现有的成员推理攻击,并对其进行广泛的实验评估,发现模型对成员推理攻击的易受攻击性与泛化差距紧密相关。提出了新的集合规则化器来减少泛化差距,并将其与 mix-up 训练方法的结合应用进行了实验,在最小程度上影响测试准确性的同时极大地提高了成员推理攻击的防御能力。