Nov, 2023
有效的后门缓解取决于预训练目标
Effective Backdoor Mitigation Depends on the Pre-training Objective
Sahil Verma, Gantavya Bhatt, Avi Schwarzschild, Soumye Singhal, Arnav Mohanty Das...
TL;DR通过对大规模网络整理的数据进行预训练,我们发现使用简单的预训练目标更有利于有效消除后门攻击,这对于使用强预训练目标与反后门攻击之间权衡的从业者至关重要。