Dec, 2022

深度神经网络是否比二年级学生更聪明?

TL;DR本文旨在研究神经网络的广泛性,提出 SMART 算法推理任务和关联的 SMART-101 数据集以评估神经网络在 6-8 岁儿童视觉语言谜题领域中的抽象、推理和概括能力,结果表明,神经网络在特定领域的表现合理,但不具有良好的广泛性,ChatGPT 虽然具有令人信服的推理能力,但答案常常是错误的。