Apr, 2024

用于调优语言模型的方差减小型零阶方法

TL;DR利用内存高效的零阶优化方法和方差缩减技术,提出了一种内存高效的零阶随机方差缩减梯度(MeZO-SVRG)的 LM 微调方法,它在多个任务中都表现出卓越的稳定性和收敛性,且减少了存储占用。