Nov, 2023
对程序化定义任务微调效果的机理分析
Mechanistically analyzing the effects of fine-tuning on procedurally defined tasks
Samyak Jain, Robert Kirk, Ekdeep Singh Lubana, Robert P. Dick, Hidenori Tanaka...
TL;DR微调预训练模型的能力和安全性的研究表明,微调很少改变模型的底层能力,而是在这些能力之上学习了一种被称为 “包装器” 的微小转换,进一步的微调则可以使模型重新利用这些能力。