Apr, 2022

预训练语言模型隐藏状态操纵在分类任务中的参数高效调整

TL;DR本篇研究提出一种简单的优化方法,只引入三个可训练向量,并将所有层的隐藏状态使用这些向量进行整合,之后将整合后的隐藏状态输入到一个任务特定的线性分类器中进行分类,通过验证原始的隐藏状态确实包含分类任务的有用信息,证明了该优化方案与 P-tuning v2 相比具有时间和参数数量的优势。