May, 2018
利用欺骗性扰动防御机器学习模型窃取攻击
Defending Against Machine Learning Model Stealing Attacks Using Deceptive Perturbations
Taesung Lee, Benjamin Edwards, Ian Molloy, Dong Su
TL;DR本文提出一种防御简单模型窃取攻击的方法,通过在提供的信息中添加噪音以限制敌对方的信息获取,使窃取模型的准确性降低至少 20% 或需要多达 64 倍的查询次数,并在此过程中保持原模型准确性。