Jul, 2024

大规模模型的参数效率和泛化能力增强:一种正则化和遮蔽低秩适应方法

TL;DR通过研究矩阵更新的内在维度,揭示了提高内在维度在降低资源消耗、优化性能方面的潜在好处,并通过正则化和梯度屏蔽方法设计了Regularized and Masked LoRA (RM-LoRA)方法,相对于原始的LoRA方法和其最新变体,在各种开源视觉和语言数据集上实现了卓越的泛化性能。