Jun, 2024

MiLoRA: 利用次要奇异分量进行参数高效的 LLM 微调

TL;DR在本文中,我们提出了一种名为 MiLoRA 的简单而有效的 LLM 微调方法,仅更新权重矩阵的次要奇异部分,而保持主要奇异部分不变,以便在微调期间最大限度地利用较少优化的子空间来学习微调数据集。通过对常识推理、数学推理和指令跟踪基准的广泛实验,展示了我们方法的卓越性能。