Feb, 2023

知识是针对微调语言模型的权重空间中的区域

TL;DR本研究关注于神经网络的权重空间和损失景观,发现细调模型在权重空间中占有良定义区域,通过在模型之间遍历这些区域找到的新模型能够具有与通过细调得到的模型相当甚至更好的性能表现,此研究的结论为高效细调提供了理论依据。