Dec, 2020
基于知识路线的视觉问答推理:深度表示嵌入的挑战
Knowledge-Routed Visual Question Reasoning: Challenges for Deep Representation Embedding
Qingxing Cao, Bailin Li, Xiaodan Liang, Keze Wang, Liang Lin
TL;DR提出了一种基于知识路线的视觉问题推理 VQA 模型评估数据集,通过控制程序来选择自然场景图和外部知识库中的三元组,强制进行多步推理,并平衡答案分布,以解决现有的 VQA 模型的浅层相关问题和注释程序不均衡的问题。