May, 2023

机器与儿童的比较:使用发展心理学实验评估LaMDA响应的优缺点

TL;DR利用儿童发展心理学经典实验评估大型语言模型(LLMs)的能力,提出一种评估LLMs能力的LRS度量,将Google的LaMDA模型应用于实验,发现LaMDA在社交认知任务中回答的适当反应与儿童相似,但在早期物体行为认知、心理理论以及因果推理方面的回答则与儿童有很大不同,表明这些领域需要更多的现实世界自发探索,不能简单地通过语言输入模式学习。