AAAIDec, 2022

净化器:通过转换置信度得分来防御数据推理攻击

TL;DR介绍一种名为 PURIFIER 的方法,该方法可以有效抵御数据样本隶属关系推断攻击,可以应用于神经网络中防御三种非法攻击方式,并且实验结果表明该方法可以大幅提高防御效果,同时不会造成可接受的实用性损失。