Jan, 2023

从语言模型中提取事实知识的微调理解

TL;DR本文分析语言模型在事实知识提取中的应用,发现 finetuning 会造成一个负面现象 - Frequency Shock,导致模型预测能力下降,因此提出两种解决方案(模型混合和混合 finetuning),并验证实验表明这两种解决方案相比原始 finetuning 均获得了显著的改进。