MMFeb, 2022

HoneyModels:机器学习蜜罐

TL;DR研究纵观 Adversarial Machine Learning 防御策略的不足,通过建立 HoneyModels 模型,给模型添加特定知识水印来检测对抗性攻击,实验表明该模型可以检测到 69.5% 的攻击,并保留原模型的功能。