Jan, 2024

非言语抽象推理的研究:多模态大型语言模型的好奇之境

TL;DR通过 Raven's Progressive Matrices 的变种,评估开源和闭源的多模态大型语言模型(MLLMs)的非语言抽象推理能力,发现了解决这类问题的困难以及开源和闭源模型之间巨大的差距,并揭示了个别视觉模块和文本模块的关键缺陷,最后通过 Chain-of-Thought 提示等方法,以显著提升模型性能(最高达 100%)。