Jun, 2024

解锁未来:探索大型语言模型的先见规划机制解释性

TL;DR我们研究了大型语言模型中的预测规划机制,通过分析信息流和内部表示的角度,我们发现多层感知器和多头自注意力组件在最后一个标记上的输出可以直接解码决策,在信息流方面,我们揭示了多头自注意力主要提取目标状态和最近步骤的范围内的信息,我们进一步探索了这些信息的编码方式,并展示了中间和上层在成功规划时在一定程度上编码了一些短期未来决策,这项研究有助于未来在大型语言模型执行规划任务方面的研究。