Jul, 2023

预训练模型选择在越界泛化与校准中的实证研究

TL;DR我们的研究强调了预训练模型在微调中对于处理分布外泛化性能和推理不确定性的影响,结果突出了预训练模型选择的显着影响,证明了在算法选择方面的性能提高,大型模型表现更好,但记忆化和真正泛化之间的平衡仍需进一步研究,我们的研究强调了预训练模型选择对于提高分布外泛化性能的重要性。