Apr, 2024

解释为基础的成员推断攻击的博弈论理解

TL;DR黑盒机器学习模型的透明性可以通过模型解释来提高,然而这也会被利用来进行会员推断攻击。本文以持续时间随机信号博弈框架为基础,研究了基于解释的阈值攻击,分析了对于一个主动攻击者在不断交互情景下发起会员推断攻击的因素,并提出了数学模型来证明存在一个可以用于发起攻击的最佳阈值。