Mar, 2022

仅标签的模型反演攻击:需要最少信息的攻击

TL;DR该研究论述了利用模型输出对数据记录进行逆推的方式,给出了基于置信度分数向量和目标模型参数的黑盒和白盒攻击方法,提出了一种仅需要标签输出就能成功逆推的新攻击方法,该方法利用目标模型的错误率计算数据记录到决策边界的中位数距离,生成置信分数向量并重构数据记录。实验结果表明相较于现有方法,我们的方法需要更少的信息即可成功重构高度可识别的数据记录。