EMNLPSep, 2021

COVR:基于真实图像的视觉组合推理测试平台

TL;DR本文提出了 COVR,一个用于基于真实图像的组合通用化的新测试平台并使用基于场景图注释的实际图像和提出几乎完全自动的生成问题答案对以及相关 (场景) 图像集的过程来创建。由于自动生成过程,COVR 便于组合划分的生成,模型可以在测试时间零或少量训练数据的情况下进行新概念和组合的通用化。我们使用 COVR 构建了组合划分,并演示了许多情况,其中最先进的预训练语言和视觉模型难以进行组合通用化。