Jun, 2024

基于互信息引导的事先训练编码器后门缓解

TL;DR本文提出了一种名为 MIMIC 的互信息引导的后门缓解技术,通过知识蒸馏从潜在后门编码器中提取干净的学生编码器,以减轻后门攻击并同时保持编码器性能。在自我监督学习中对两个后门攻击进行的评估表明,MIMIC 可以显著降低攻击成功率,仅利用不到 5% 的干净数据,超过七种最先进的后门缓解技术。