ICMLJul, 2020

视觉问答中的场景图推理

TL;DR我们提出了一种基于场景图和强化学习的方法来解决视觉问答任务,实验结果表明该方法在 GQA 数据集上已达到接近人类水平的效果。