Oct, 2024
一项初始化的方法:通过解释方差进行微调适应
One Initialization to Rule them All: Fine-tuning via Explained Variance
Adaptation
Fabian Paischer, Lukas Hauzenberger, Thomas Schmied, Benedikt Alkin, Marc Peter Deisenroth...
TL;DR本研究针对现有微调方法效率低下的问题,提出了一种新的解释方差适应方法(EVA)。通过数据驱动的方式初始化新权重,EVA显著提升了收敛速度,并在多个任务上实现了最佳的平均得分。这一方法为基础模型的应用提供了更优的微调策略。