Feb, 2024

KS-Lottery: 查找多语言模型的认证彩票

TL;DR通过使用 Kolmogorov-Smirnov 检验分析微调前后的参数分布变化,我们提出了 KS-Lottery 方法,以识别在多语言微调中非常有效的少数 LLM 参数集。我们进一步从理论上证明了 KS-Lottery 可以在嵌入层中找到被证实的中奖票,使用这些参数进行微调可以保证与全面微调相同的性能表现。与其他参数高效调整算法在翻译任务上相比,实验结果显示 KS-Lottery 在找到的参数集上进行微调,可以获得与全面微调 LLM 相当的性能,同时参数数量较少。令人惊讶的是,我们发现微调 LLaMA 中的 18 个标记的嵌入层就足以达到微调翻译性能。代码和模型将向公众发布。