Aug, 2024

高效微调大模型的嵌套低秩适应方法(NoRA)

TL;DR本文提出了一种新的参数高效微调方法——嵌套低秩适应(NoRA),旨在解决传统低秩适应(LoRA)在微调过程中参数数量过多和未充分利用预训练权重的问题。NoRA通过采用双层嵌套结构和奇异值分解(SVD),显著减少了可调参数数量,并在多项任务评估中表现出相较于LoRA及其变种更优的性能,降低了微调的参数、训练时间和内存使用,同时性能提升了2.2%。