Feb, 2024

稀疏 MeZO: 更少参数在零阶 LLM 微调中取得更好性能

TL;DR通过稀疏的零阶优化方法,提高大型语言模型的内存效率并改善性能。