ACLMar, 2021

开放式视觉问题回答(VQA)任务开发和评估中的瓶颈突破:“你对并不代表我错

TL;DR提出了基于 Alternative Answer Sets (AAS) 的语义度量方法,通过修改现有的 VQA 算法实现多个有效答案,提高了视觉理解和组合问题回答 (GQA) 数据集的表现。