Nov, 2023

KNVQA:用于评估基于知识的视觉问答的基准

TL;DR该研究论文提出了一种新的知识驱动图像问答(KNVQA)评估方法,以解决大型视觉 - 语言模型在现实场景中存在的物体虚构和事实准确性两个关键问题,并开发了相应的 KNVQA 数据集进行评估,从而有效评估现有方法的细粒度能力并为大型视觉 - 语言模型的进一步优化提供潜在思路。