Jan, 2024

大规模生成式人工智能模型缺乏视觉数值感知能力

TL;DR通过使用大规模 Transformer 架构的生成式人工智能模型,本研究调查了是否能可靠地命名简单视觉刺激中的物体数量或生成包含 1-10 范围内目标数量物体的图像。令人惊讶的是,所有考虑的基础模型都没有以人类的方式表现出来:即使在小数量下也会出现明显错误,响应的变异性通常没有按系统方式增加,错误的模式也随物体类别而变化。我们的研究结果表明,高级人工智能系统仍然缺乏支持直观理解数字的基本能力,这对人类的数字能力和数学发展至关重要。