CVPRMar, 2023

通过去混淆表示学习进行后门防御

TL;DR本文提出了一种因果性启发的后门防御方法(CBD),通过构建因果图模型污染数据的生成过程,并将后门攻击作为混淆因素,利用混淆模型学习去混淆的特征表示,最终实现可靠的分类预测。经过多个基准数据集的实验验证,CBD 方法有效地减少了后门威胁,同时在预测良性样本的准确性方面表现出高水平。