Oct, 2020

中毒的分类器不仅被植入后门,而且本质上已经失效

TL;DR本文提出了一种新的被污染分类器的威胁模型,并通过测试时间、人机交互式攻击方法生成多个有效的替代触发器,以应对被污染分类器的多方攻击,同时也比以前的工作更加可扩展和高效。该攻击方法是由解决对抗样本问题的平滑方法和人机交互式颜色和图像裁剪技术共同实现的。实验证明,该方法不光可以对付第三方的攻击,同时还能让用户轻松判断受污染分类器是否存在地下入口。