Jun, 2021
生成、标注和学习:合成文本的自然语言处理
Generate, Annotate, and Learn: Generative Models Advance Self-Training
and Knowledge Distillation
TL;DR该研究探讨了使用语言模型作为一种合成无标注文本的来源来进行自然语言处理,并提出了“生成、注释和学习(GAL)”的通用框架,通过对合成文本进行知识蒸馏、自训练和少样本学习应用来生成高质量特定任务文本,最终在多个应用中取得了显著的收益。