May, 2024
从显式 CoT 到隐式 CoT:逐步学习内化 CoT
From Explicit CoT to Implicit CoT: Learning to Internalize CoT Step by Step
Yuntian Deng, Yejin Choi, Stuart Shieber
TL;DR通过逐渐去除中间步骤并微调模型,我们的方法使得一个 GPT-2 Small 模型能够以高达 99% 的准确率解决 9 乘 9 的乘法问题,而标准训练无法解决 4 乘 4 以上的乘法问题。