ECCVSep, 2020

利用问题类型先验知识的多重交互学习,限制视觉问答中的答案搜索空间

TL;DR这篇论文提出了一种新的 VQA 模型,利用问题类型先验信息,通过利用不同联合模态方法在回答不同类型的问题时的行为之间的多重交互来优化 VQA,实验表明该方法表现最佳。