Jun, 2024

用手术刀剖析 Ullman 变体:为何 LLMs 在对错误信念任务的微小改动中失败?

TL;DR通过引入 SCALPEL 技术,我们发现使得明显的常规推理明确的修改(如透明物体的观察意味着识别其内容)能保持大型语言模型的性能,暗示大型语言模型在修改的心智任务上的失败可能是由于缺乏更一般的常识推理,而不是对心理状态的表示失败。我们认为 SCALPEL 可以对解释大型语言模型在其他情况下的成功和失败有所帮助。