May, 2024

从显式 CoT 到隐式 CoT:逐步学习内化 CoT

TL;DR通过逐渐去除中间步骤并微调模型,我们的方法使得一个 GPT-2 Small 模型能够以高达 99% 的准确率解决 9 乘 9 的乘法问题,而标准训练无法解决 4 乘 4 以上的乘法问题。