Jun, 2024

FuseGen: 基于数据生成的零样本学习的 PLM 融合

TL;DR基于数据生成的零样本学习通过由预训练语言模型生成的合成数据集对小任务特定模型进行训练,虽然有效果,但往往受到合成数据集质量低的限制。本文提出了 FuseGen,一种基于数据生成的零样本学习框架,通过利用多个预训练语言模型和训练过的小任务特定模型,在合成数据集中引入了一种新的子集选择标准,从而提供了上下文反馈,通过迭代数据生成增强了数据集质量。本方法在各种任务上的广泛实验证明,相较于现有方法,FuseGen 显著提升了小任务特定模型的性能,且不依赖于预训练语言模型。代码可在提供的链接中获得。