Nov, 2022

调整语言模型作为训练数据生成器,用于增强少样本学习

TL;DR本文从不同的角度研究 PLM 的 few-shot 学习,通过调参后作为生成器合成了大量的新训练样本,使用加权最大似然度量进行训练以鼓励生成器生成分类标签的样本,并使用正则化 fine-tuned 在小样本和合成样本上取得了比现有 few-shot 学习方法更好的结果,GLUE 基准测试中超过无增加方法 5 + 平均点数和增加方法 3 + 平均点数。