Jun, 2023

有限资源下的大型语言模型全参数微调

TL;DR提出了一种名为 LOw-Memory Optimization(LOMO)的新优化器,该优化器将梯度计算和参数更新融合为一步,可以在单台机器上通过充分利用记忆方案使大型语言模型(LLMs)进行全参数微调的训练过程中降低内存使用,并成功地在一台装有 8 个RTX 3090 的机器上对一个拥有 65B 参数的模型进行充分微调。