Apr, 2024
用于调优语言模型的方差减小型零阶方法
Variance-reduced Zeroth-Order Methods for Fine-Tuning Language Models
Tanmay Gautam, Youngsuk Park, Hao Zhou, Parameswaran Raman, Wooseok Ha
TL;DR利用内存高效的零阶优化方法和方差缩减技术,提出了一种内存高效的零阶随机方差缩减梯度(MeZO-SVRG)的 LM 微调方法,它在多个任务中都表现出卓越的稳定性和收敛性,且减少了存储占用。