Apr, 2024

用较少的令牌预训练小型基础语言模型

TL;DR我们研究了使用继承和训练的简单方法来构建小型基础语言模型的有效性,并通过实验证明其在各种设置中的功效。