Feb, 2024

NTK 条件下的 LoRA 训练无虚假局部极小值

TL;DR通过理论分析,在神经切线核(NTK)范式下,我们发现使用低秩适应(LoRA)进行微调有助于消除虚假的局部极小值点,从而使得梯度下降算法可以找到低秩解。