Mar, 2022

你能分清左右吗?一个新的 VQA 挑战

TL;DR本文提出了一种用于视觉问答模型评估强度和弱点的方法,通过提供新的数据集UOUC并应用几个定量度量来测量其分解分离性,同时展示了模型在分解分离性和简单推理能力方面的挑战,表明UOUC可能成为VQA的一个强有力的基准。