Feb, 2024

Flora: 低秩适配器是隐形的梯度压缩器

TL;DR提出了低秩适应(LoRA)方法,通过训练较少的参数来减少优化状态的存储消耗,但会限制整体权重更新矩阵为低秩,本研究基于观察到低秩适应可以用随机投影来近似,因此提出了 Flora 方法,通过重新采样投影矩阵实现高秩更新,同时享受优化状态的次线性空间复杂度,实验证明了我们方法的有效性。