Feb, 2024

大型语言模型中零阶联邦调优的收敛性

TL;DR联邦学习和大型语言模型的交汇为隐私保护自然语言处理开启了新时代,提出了一种将内存高效的零阶优化与联邦设置相结合的方法 FedMeZO,以加快收敛速度和减少 GPU 内存使用。