Jun, 2024

初始化对 LoRA 微调动态的影响

TL;DR该篇论文研究了初始化在低秩适应(LoRA)中的作用,结果显示将 B 初始化为零且将 A 初始化为随机可以比其他方案获得更好的性能。