CVPRApr, 2023

自监督学习中基于补丁的后门攻击的防御

TL;DR本文研究针对自监督学习中的数据投毒后门攻击,提出了一种三步防御管道,其中包括使用训练模型搜索被毒害的样本并将其从训练集中移除的防御算法 PatchSearch。研究结果表明,PatchSearch 是一种有效的防御,其表现优于基线和最先进的防御方法(包括使用额外的干净、可靠数据的方法),可以将模型在包含触发器的图像上的准确性从 38.2% 提高到 63.7%,接近于干净模型的准确性 64.6%。