Mar, 2024

单调改写提高语言模型启示的泛化能力

TL;DR我们提出了一种单调改写方法(MonoPara),通过一个将提示或指令改写成更低困惑度的改写语言模型和一个用于限制生成更低困惑度的目标语言模型的组合解码过程,对原始提示进行改写而不改变其语义含义,从而降低生成的困惑度,提高零样本语言模型的表现,并且有效改善语言模型对扰动和未见任务指令的泛化能力。