CVPRMar, 2023

检测预训练编码器中的后门

TL;DR本文提出了 DECREE,是第一个用于预训练编码器的后门检测方法,无需分类器头或输入标签,并通过对 400 多个遭受三种范式攻击的编码器的评估,在 ImageNet 和 CLIP 400 百万图像文本对上,我们的方法一致具有很高的检测准确性,即使我们只有有限或没有访问预训练数据集。