Aug, 2023

通过鲁棒临界微调改善对抗训练的泛化性能

TL;DR本研究提出了一种名为Robustness Critical Fine-Tuning (RiFT)的新方法,其核心思想是通过在非鲁棒性关键模块上进行微调,利用冗余容量来提高泛化能力而不损害对抗性鲁棒性。实验证明,该方法可以在不损害对抗鲁棒性的同时,显著改善泛化能力和超出分布鲁棒性约1.5%。