May, 2024

注入主动防御后门以减轻后门攻击

TL;DR这篇论文提出了一种名为 PDB(Proactive Defensive Backdoor)的新颖防御方法,通过在训练过程中主动注入防御型后门,有效地抑制恶意后门,保持对攻击者的秘密,并在原始任务上确保模型的实用性。实验结果表明,我们的方法在各种数据集和模型上实现了最先进的防御性能。