Jan, 2024

小型语言模型可以自我纠正

TL;DR我们介绍了在生成式语言模型中的内在自我修正(ISC)方法,旨在通过自动触发方式来纠正 LM 的初始输出,即使对于具有 60 亿参数的小型 LM。我们通过构建自我修正数据和提出部分答案屏蔽(PAM)的管道来进行实验,结果表明使用 ISC 生成的输出优于没有自我修正的输出。我们相信,通过赋予它们内在自我纠正的能力,甚至小型 LM 的输出质量也可以进一步提高。