EMNLPOct, 2023

PAC 调谐:基于 PAC 驱动扰动梯度下降的细调预训练语言模型

TL;DRPAC-tuning 通过两个阶段的微调和噪声注入修改梯度,成功应对了微调任务的挑战,并在 5 个基准测试任务中表现优于强基准方法,从而进一步证实了在目前使用 Adam 优化器进行训练的任何其他设置中应用 PAC 训练的潜力。