EMNLPOct, 2023

以语言为基础的视错觉衔接:视觉 - 语言模型是否像人类一样感知错觉?

TL;DR通过构建包含五种视觉错觉的数据集并制定四项任务,研究发现,虽然整体对齐性较低,但更大的模型更接近人类感知且更容易受到视觉错觉的影响,这将促进对人类和机器中的视觉错觉有更深入的理解,并为未来能够更好地使人类和机器在感知和交流共享的视觉世界方面达到一致的计算模型提供基础。