Nov, 2023

BadCLIP: 多模态对比学习的双嵌入引导后门攻击

TL;DR本文介绍了一种名为 oolns 的抵抗后门检测和模型优化防御的攻击,通过基于贝叶斯规则的双嵌入引导框架,在自然触发模式中实现了视觉触发模式的文本目标语义近似,并通过优化视觉触发模式与目标视觉特征的一致性对目标样本进行了污染,证明其对现有的后门防御具有显著优势,引发了对多模态对比学习的潜在威胁的关注,并鼓励开发更加健壮的防御机制。