Mar, 2025

自回归思维链的学习理论

TL;DR本研究解决了在给定序列到下一个标记生成器的基础类中,如何学习提示到答案映射的问题,特别是通过多步迭代固定的生成器生成思维链。我们提出了一种简单的基础类,该类支持普适性表达和可计算的思维链学习,关键发现是时间不变性使得样本复杂度与思维链长度无关。