Mar, 2024

STAR:基于动态主动学习的约束式纵横比用于大型语言模型的高效微调

TL;DR通过结合基于不确定性的主动学习和 LoRA,本论文提出了一种新的方法,动态度量不确定性缺口且在 LoRA 训练中引入正则化方法,这种方法在三个复杂推理任务上优于现有的基线模型。