May, 2024

在残差流中以Transformer表示信念状态几何

TL;DR我们的研究显示,在训练大型语言模型进行下一个标记预测时,我们构建了一种计算结构,其表现为对数据生成过程隐藏状态的信念更新的元动力学。我们预测并发现,信念状态在变压器的残余流中线性表示,即使预测的信念状态具有高度复杂的分形结构。我们探讨了信念状态几何在最终残余流中或分布在多个层的残余流中的情况,提供了解释这些观察的框架。此外,我们证明了推断的信念状态包含关于整个未来的信息,超出变压器的显式训练目标——局部下一个标记预测。我们的工作提供了连接训练数据结构和变压器使用的计算结构和表示的框架。