Mar, 2021
AGQA:组合式时空推理的基准测试
AGQA: A Benchmark for Compositional Spatio-Temporal Reasoning
TL;DR本论文针对计算机视觉模型做了一个新的基准,名为Action Genome Question Answering (AGQA),并提供了3.9M个问题答案对的平衡子集,以最小化偏倚。AGQA引入了多个训练/测试集来测试各种推理能力,包括新颖组合的泛化,间接引用以及更多的组合步骤。这项研究发现,最好的模型仅能比利用语言偏见的非视觉基准优秀一些;并且现有的模型都无法推广到训练中未见过的新颖组合。