Mar, 2024
下一个标记预测的陷阱
The pitfalls of next-token prediction
TL;DR通过模型中的autoregressive inference和teacher-forced training两个关键阶段的独立处理来解决关于next-token预测的问题,研究揭示了在特定类的任务中,teacher-forcing不仅可能在autoregressive inference阶段出现错误叠加的问题,还可能在首次学习过程中就无法准确预测下一个token的问题。研究通过实验证明了这一问题,并提出通过预测多个token来解决这一失败情况的初步证据。这一发现希望能够引发关于next-token预测范式之外的讨论和探索。