BriefGPT.xyz
大模型
Ask
alpha
关键词
sublinear space complexity
搜索结果 - 1
Flora: 低秩适配器是隐形的梯度压缩器
提出了低秩适应(LoRA)方法,通过训练较少的参数来减少优化状态的存储消耗,但会限制整体权重更新矩阵为低秩,本研究基于观察到低秩适应可以用随机投影来近似,因此提出了 Flora 方法,通过重新采样投影矩阵实现高秩更新,同时享受优化状态的次线
→
PDF
5 months ago
Prev
Next