Nov, 2023

让大型语言模型能够从规则中学习

TL;DR通过从详细的规则中提取知识并显式编码到大型语言模型的参数中,我们提出了一种新的学习范式,即规则蒸馏,并证明这种方法在样本大小和泛化能力方面比基于示例的学习更加高效。