BriefGPT.xyz
Ask
alpha
关键词
look-ahead planning mechanism
搜索结果 - 1
解锁未来:探索大型语言模型的先见规划机制解释性
我们研究了大型语言模型中的预测规划机制,通过分析信息流和内部表示的角度,我们发现多层感知器和多头自注意力组件在最后一个标记上的输出可以直接解码决策,在信息流方面,我们揭示了多头自注意力主要提取目标状态和最近步骤的范围内的信息,我们进一步探索
→
PDF
13 days ago
Prev
Next