Jun, 2024

HARE:人类先验:小语言模型效率的关键

TL;DR在资源受限环境中进行高效语言模型训练的研究,提出了一种利用人类先验知识进行数据构建的原则,并通过在简洁数据集上训练 HARE-1.1B 模型来验证该原则的有效性。