Dec, 2020

以对象为中心的视觉推理诊断

TL;DR该研究旨在通过评估不同模型在视觉推理方面的表现来回答视觉问答模型是否在进行视觉推理,为此,研究使用了GQA数据集中提供的目标细粒度标注,提出了一种系统性的目标中心的视觉推理诊断方法,并开发了一个名为图形推理机的诊断模型,该模型使用概率场景图替代纯符号视觉表示,并对视觉推理模块进行了教师强制训练。