ACLMar, 2022

ChartQA: 针对图表的问题回答的视觉和逻辑推理基准

TL;DR本文提出了一个大规模基准测试,包括 9.6K 个人为编写的问题和 23.1K 个由人类编写的图表摘要生成的问题,并运用两种基于 Transformer 的模型来回答问题,这些模型将图表的视觉特征和数据表统一起来处理来解决目标检测中的视觉和逻辑推理等问题。