Jul, 2024
揭示无法察觉的事物:通过可解释性探索白盒成员推断的视角
Unveiling the Unseen: Exploring Whitebox Membership Inference through the Lens of Explainability
Chenxi Li, Abhinav Kumar, Zhen Guo, Jie Hou, Reza Tourani
TL;DR通过统计方法,本文旨在解决隐含特征对攻击效果的影响以及基于原始数据特征的攻击根本原因不足的问题,并提出了一个攻击驱动的可解释框架,通过集成目标和攻击模型,识别导致成功成员推理攻击的原始数据上最具影响力的特征。我们提出的攻击显示了与最先进的攻击技术相比高达 26%的改进。