Oct, 2023

LEMON: 无损模型扩展

TL;DR通过利用较小但已经预训练的模型的权重来初始化缩放模型,并使用专门为缩放模型设计的优化学习率调度器进行模型训练,LEMON 有效地减少了训练时间,降低了计算成本。