Sep, 2024
SVFit:使用奇异值的参数高效微调大型预训练模型
SVFit: Parameter-Efficient Fine-Tuning of Large Pre-Trained Models Using
Singular Values
TL;DR本研究解决了在资源受限环境中,完全微调大型预训练模型时的内存挑战。我们提出的SVFit方法通过奇异值分解初始化低秩矩阵,采用关键奇异值作为可训练参数,从而提高了梯度下降的效率和模型的泛化能力。研究结果表明,SVFit在多个自然语言理解和计算机视觉任务中表现优于LoRA,同时所需可训练参数减少了16倍。