AAAIMar, 2021
基于知识的多模态 VQA 答案验证
Multi-Modal Answer Validation for Knowledge-Based VQA
Jialin Wu, Jiasen Lu, Ashish Sabharwal, Roozbeh Mottaghi
TL;DR本文提出一种名为 MAVEx 的多模态回答验证方法,采用了图像、文本和常识知识库进行知识检索,通过学习从杂乱无序的知识源中提取相关知识、选择不同候选答案的合适知识源以及以此验证合适答案的方法,从而在知识驱动的视觉问答中取得了最好的实验效果。