Sep, 2024

CLIP中的对抗性后门防御

TL;DR本研究针对多模态对比预训练模型(如CLIP)在后门攻击中易受攻击的问题,提出了一种新颖的数据增强策略——对抗性后门防御(ABD)。该方法通过与精心设计的对抗样本对齐特征,有效地打断了后门关联,实现了对传统单模态和多模态后门攻击的强有力防御,显著降低了攻击成功率。