Nov, 2023

预测性思维:LLMs 作为非典型的主动推理代理

TL;DR大型语言模型通常被概念化为被动的预测器或模拟器,但我们通过借鉴认知科学和神经科学中的主动推断理论来重新概念化大型语言模型。我们检查传统主动推断系统和大型语言模型之间的相似性和差异,得出结论说,目前大型语言模型缺乏在行动和感知其行动影响之间的紧密反馈循环,但它们仍符合主动推断范式。我们列举了为什么这个循环可能很快就会闭合的原因,以及可能的后果,包括增强模型的自我意识和通过改变世界来最小化预测误差的动力。