May, 2023

PlaSma: 将小型语言模型转化为更好的规程知识模型,用于(反事实的)规划

TL;DR本文提出了 PlaSma,一种利用小型语言模型赋予程序化知识和(反事实的)规划能力的新方法,并介绍了计划的符号化程序知识蒸馏和推理时间算法以及一个新的任务,即对计划进行修订以应对反事实情况的 “反事实规划”,并展示了在原始和反事实情况下,规模比大的教师模型(770M-11B 参数)小几个数量级的模型可以达到甚至超越它们的能力。