Aug, 2023

RealCQA: 科学图表问答作为一阶逻辑的测试平台

TL;DR我们在真实世界的图表中对图表视觉问答任务进行了全面的研究,提出了一种基于模板的图表问题创建的新型分类法,并引入了一个包含新答案类型的数据集,从而为模型的一阶逻辑能力评估提供了一个标准,该研究通过对真实世界超出分布的数据集的实验结果,对大规模预训练模型进行了稳健评估,并推进了图表视觉问答和神经网络的形式逻辑验证领域。