May, 2023

PaD: 通过程序辅助精馏专门针对推理的大型模型

TL;DR提出了 Program-aided Distillation(PaD)算法,该算法使用程序辅助推理强化可特化的模型,并通过自动化错误检查帮助它们克服错误的推理步骤,实验证明 PaD 具有比 LLMs 更高的训练效率,并能显著提高推理能力。