May, 2022

PoisonedEncoder: 对对比学习的未标记预训练数据进行污染

TL;DR本文提出一种数据污染攻击 ——PoisonedEncoder,该攻击通过在无标签的预训练数据中注入精心制作的污染输入,为多目标下游任务构建基于受攻击者选择的中毒编码器的下游分类器,使得这些分类器将受攻击者选择的任意干净输入分类为受攻击者选择的任意类别,同时我们提出了一种针对对比度学习的方法来近似求解该数据污染攻击问题,并评估了五种针对 PoisonedEncoder 的防御策略。