Jan, 2025

基于互信息上界的LoRA缩放法则

TL;DR本文研究了模型性能、参数和数据复杂性之间的关系,特别是在大型模型的LoRA微调过程中。提出了一种基于互信息上界的内部度量,能够更准确地捕捉微调过程中新旧知识之间的依赖关系。实验结果表明,该指标在评估LoRA微调的缩放法则方面优于传统的外部度量方法。