Dec, 2022

HyPe: 利用隐藏表示扰动来更好地微调预训练语言模型

TL;DR本研究提出了一种名为 HyPe 的 Fine-tuning 技术,该技术通过扰动 Transformers 层的隐藏表示来缓解 Fine-tuning 中的过拟合和表示坍塌问题,并在 GLUE 等自然语言推理数据集上进行了实验,结果表明,HyPe 优于基本的 Fine-tuning 技术且不会增加额外的计算成本。