BriefGPT.xyz
Ask
alpha
关键词
false belief task
搜索结果 - 2
用手术刀剖析 Ullman 变体:为何 LLMs 在对错误信念任务的微小改动中失败?
通过引入 SCALPEL 技术,我们发现使得明显的常规推理明确的修改(如透明物体的观察意味着识别其内容)能保持大型语言模型的性能,暗示大型语言模型在修改的心智任务上的失败可能是由于缺乏更一般的常识推理,而不是对心理状态的表示失败。我们认为
→
PDF
16 days ago
大型语言模型是否知道人类所知道的?
通过评估大量语言暴露对理解心灵理论的影响,发现语言的统计学学习能够部分解释人类认知发展中心灵理论的发展,但是其他机制也起到重要作用,因为最先进的语言模型 GPT-3 尽管暴露于更多的语言环境下,但其表现并不能完全解释人类的行为
PDF
2 years ago
Prev
Next