Feb, 2024

大规模预训练神经网络中的人类化几何抽象

TL;DR人类对抽象结构的识别和操作能力十分出色,尤其在几何领域中显得更为明显。最近的认知科学研究表明,神经网络并没有共享这种能力,得出结论认为人类的几何能力来自人类心智表示中的离散符号结构。然而,人工智能领域的进展表明,经过标准架构的扩展模型规模和训练数据量后,神经网络开始表现出更类似人类推理的能力。在本研究中,我们重新审视认知科学对几何视觉处理的实证结果,并确定了几何视觉处理中的三个关键偏见:对复杂性、规律性和部分与关系的感知敏感性。我们测试了从文献中探索这些偏见的任务,并发现在人工智能中使用的大型预训练神经网络模型表现出更类似人类的抽象几何处理能力。