Jun, 2024

通过指令向量进行大规模语言模型精调的可解释性灾难性遗忘

TL;DR通过考察模型对知识理解和指令跟踪的影响,本文揭示了大语言模型在微调过程中遗忘的内在机制,并以指令向量(IV)框架为基础,提出了IV引导训练的方法,以缓解灾难性遗忘。实证测试表明这种新方法的有效性,支持IV与遗忘之间的关系。