Oct, 2023

NOLA:网络作为低秩随机基组合的线性组合

TL;DR通过重新参数化使用线性组合随机生成的矩阵(基)的低秩矩阵,并仅优化线性混合系数,NOLA 将创新地克服了 LoRA 中的秩一下界,与等效参数计数的模型相比,NOLA 在自然语言处理和计算机视觉任务中表现得很好,并且证明能在更大的模型中减少一半的参数而不降低性能。