EMNLPOct, 2023
PAC 调谐:基于 PAC 驱动扰动梯度下降的细调预训练语言模型
PAC-tuning:Fine-tuning Pretrained Language Models with PAC-driven Perturbed Gradient Descent
Guangliang Liu, Zhiyu Xue, Xitong Zhang, Kristen Marie Johnson, Rongrong Wang
TL;DRPAC-tuning 通过两个阶段的微调和噪声注入修改梯度,成功应对了微调任务的挑战,并在 5 个基准测试任务中表现优于强基准方法,从而进一步证实了在目前使用 Adam 优化器进行训练的任何其他设置中应用 PAC 训练的潜力。