May, 2024

评估和模拟社会智能:人类与人工智能能力的比较研究

TL;DR该研究提出了一个用于评估社交智能的基准,引入了逆向推理和逆向规划这两个评估任务,通过基于递归贝叶斯推理的计算模型对人类行为模式进行解释,实验证明了人类在整体表现、零样本学习、一次推广和多模态适应性方面超越了最新的 GPT 模型,并显示出 LLMs 倾向于依赖模式识别来进行快速计算,对其是否拥有真正的人类级社交智能产生了质疑。