Oct, 2023

有效且参数优化的复用微调模型

TL;DR提出了针对使用多个经过精调的特定任务模型的参数高效重用方法 PERU。通过稀疏任务向量注入到合并模型中,通过截断幅值来创造 PERU-FFT,以重用完全精调的模型。通过奇异值分解来近似 LoRA 矩阵,提出了使用低秩矩阵重用 LoRA 精调模型的 PERU-LoRA。在计算机视觉和自然语言处理任务上进行了大量实验证明了该方法的有效性和参数效率。与现有的重用模型方法相比,提出的 PERU-FFT 和 PERU-LoRA 取得了明显优势,并且在性能上与每个任务使用精调模型相当。