ACLSep, 2020

不止尺寸重要:小型语言模型也是少样本学习者

TL;DR该研究通过将文本输入转换为包含任务描述的填空问题,并结合梯度优化和利用未标记数据,成功地创造了小型语言模型,达到了与 GPT-3 相似的性能,为小型语言模型的成功应用提供了关键因素。