Jul, 2024

LogicVista: 视觉语境下的多模式LLM逻辑推理基准

TL;DR我们提出了LogicVista,这是一个评估多模态大型语言模型在视觉环境中综合逻辑推理能力的评估基准。我们通过448个多项选择题综合评估了8个多模态大型语言模型在LogicVista上的逻辑认知能力,包括5个逻辑推理任务和9种不同的能力。