Jan, 2024

预训练模型引导的零样本对抗鲁棒性微调

TL;DR本研究提出了预训练模型引导的对抗微调(PMG-AFT)方法,通过精心设计辅助分支,利用原始预训练模型的监督来增强模型的零样本对抗鲁棒性。对 15 个零样本数据集进行的广泛实验证明,PMG-AFT 在顶部 1 的抗干扰准确性方面显著优于最先进的方法,平均提高了 4.99%。此外,我们的方法还能持续改善干净准确性,平均提高了 8.72%。