Sep, 2024

多模态对比学习中的高效后门防御:一种缓解威胁的标记级别遗忘方法

TL;DR本研究解决了多模态对比学习中后门攻击的安全风险,提出了一种基于机器遗忘的高效防御机制。通过创建小规模的中毒样本并采用新的标记级别部分遗忘训练方案,本文显著提高了模型在面对后门攻击时的防御效率,同时保持了较高的干净准确率。