Apr, 2024

从弱到强的外推加速对准

TL;DR通过ExPO方法,我们展示了将训练数据较少的模型推向或超越完全训练模型的可能性,同时在不同模型规模上显示出合理的可伸缩性,这表明模型外推在发掘大型语言模型能力方面具有潜力,值得未来探索。