Apr, 2024

PiSSA:大型语言模型的主要奇异值和奇异向量适应

TL;DR通过使用降维方法和奇异值分解(SVD)初始化,PiSSA 方法能够在较短的时间内收敛并获得比 LoRA 更好的性能。