Sep, 2020

来自反事实解释的模型提取

TL;DR本文介绍了后验方法中计数事实解释作为黑盒机器学习模型的后解释技术中越来越受欢迎的方法,但使用该方法泄露了与模型相关的信息,攻击者可以建立一个忠实副本。通过在真实世界数据集上进行评估,我们证明了该攻击可以在低查询预算下实现高保真度和高准确度的模型提取,进而引出了隐私问题。