EMNLPOct, 2023

基于知识的视觉问答的简单基准

TL;DR这篇研究论文介绍了一种基于知识的视觉问答(KB-VQA)问题的方法,通过在上下文中进行高效的学习,使用问题相关的标题作为上下文信息,而无需训练或访问外部数据库或 API,实现了最先进的准确度。