Jun, 2022
REVIVE: 基于知识的视觉问答中区域视觉表达的重要性
REVIVE: Regional Visual Representation Matters in Knowledge-Based Visual
Question Answering
TL;DR研究表明视觉表征在基于知识的视觉问答(VQA)中具有重要意义,特别是物体区域信息的利用可以显著提高系统性能。作者提出了一种名为 REVIVE 的新型基于知识的VQA方法,该方法旨在利用物体区域的显式信息不仅在知识检索阶段,而且在答案模型中提高系统性能,并在标准OK-VQA数据集上实现了最新的最高性能。