Mar, 2024

基于知识的VQA的知识浓缩和推理

TL;DR我们提出两个协同模型:知识浓缩模型和知识推理模型。这两种浓缩的知识被无缝地集成到我们的知识推理模型中,巧妙地导航综合信息以得出最终答案。与以前的方法相比,我们的方法在基于知识的VQA数据集上(OK-VQA的65.1%,A-OKVQA的60.1%)取得了最先进的性能,而不依赖GPT-3(175B)生成的知识。