Apr, 2025

超越下一个标记的视角

TL;DR本研究解决了当前因果语言模型训练中,标记预测与人类写作和推理过程之间的差异问题。论文提出了一种名为Trelawney的新方法,通过重新排列和处理训练数据序列,无需改动模型架构即可更准确地模拟真实数据生成过程。研究显示,该方法在多个关键基准上表现出提升,尤其在规划、算法推理和故事生成任务上,并能有效生成长期目标,从而显著增强模型的规划和推理能力。