Mar, 2024

BiLoRA:一个双层优化框架用于大型预训练模型的过拟合抗性低秩适应

TL;DR基于双层优化的 BiLoRA 方法在降低过拟合风险的同时,显著优于 LoRA 和其他微调方法,并具有相似数量的可训练参数。