Nov, 2022

超调:大型语言模型的自适应调节方法,无需借助反向传播算法

TL;DR本文提出了 HyperTuning 方法用于模型适应,可以生成特定任务的参数并在大量多样化语言任务上进行多任务微调。通过在 P3、MetaICL 和 Super-NaturalInstructions 数据集上的表现,证明该方法可以有效地为新任务生成参数,并改善性能。