ICMLMay, 2024

基于关键点的渐进式思维链提取法用于 LLMs

TL;DRKPOD 框架通过利用遮罩学习来鼓励学生精确模仿关键点标记,并通过渐进式教学策略逐步扩展到整个论证过程,实现了来自大型语言模型的推理能力向较小学生模型的转移,取得了远超之前方法的广泛实验结果。