Oct, 2024

一项初始化的方法:通过解释方差进行微调适应

TL;DR本研究针对现有微调方法效率低下的问题,提出了一种新的解释方差适应方法(EVA)。通过数据驱动的方式初始化新权重,EVA显著提升了收敛速度,并在多个任务上实现了最佳的平均得分。这一方法为基础模型的应用提供了更优的微调策略。