May, 2025

思维链令牌作为计算机程序变量

TL;DR本研究探讨了思维链令牌(CoT)在大型语言模型(LLM)中如何影响复杂推理任务的解决,特别是在多位数字乘法和动态编程两项组合任务中。研究发现,仅保留存储中间结果的令牌便可实现类似的性能表现,同时探索了在不同形式下存储中间结果对模型性能的影响,表明CoT令牌在某种程度上类似于计算机程序变量,这为理解LLM的内部机制提供了新的视角。