Mar, 2024

AS-ES 学习:小模型中高效的 CoT 学习

TL;DR采用新的训练方法 AS-ES(Abstractive Segments - Extractive Segments)学习,利用 CoT 中的内在信息进行迭代生成,实验证明该方法在 MWP 和 PET 摘要等 CoT 广泛任务上优于直接的 seq2seq 训练,无需数据增强或改变模型本身,并且进一步探讨了小模型学习 CoT 低效的原因并解释了 AS-ES 学习的原理,为 CoT 的基本机制提供了洞察。