ACLApr, 2024

简化规模生成式语言模型中的新能力

TL;DR通过简化预训练数据,研究表明在训练数据规模较小的模型上,也能出现零样本学习能力,并且模型规模大小与计算资源、数据集大小之间呈现幂律关系。