AAAIMar, 2021

基于知识的多模态 VQA 答案验证

TL;DR本文提出一种名为 MAVEx 的多模态回答验证方法,采用了图像、文本和常识知识库进行知识检索,通过学习从杂乱无序的知识源中提取相关知识、选择不同候选答案的合适知识源以及以此验证合适答案的方法,从而在知识驱动的视觉问答中取得了最好的实验效果。