May, 2021

黑盒解剖仪:面向基于擦除的硬标记模型窃取攻击

TL;DR该研究提出了一种新的黑盒模型窃取方法,主要包括基于CAM的擦除策略和基于随机擦除的自知识蒸馏模块,通过从受害者模型中获取潜在的信息容量并使用替代模型的软标签缓解过度拟合问题,最终能够提高模型窃取效果达到最多8.27%的提升,并有望在实际API和防御机制中使用。