BriefGPT.xyz
Jun, 2023
百科问答视觉:有关细粒度类别详细属性的视觉问题
Encyclopedic VQA: Visual questions about detailed properties of fine-grained categories
HTML
PDF
Thomas Mensink, Jasper Uijlings, Lluis Castrejon, Arushi Goel, Felipe Cadar...
TL;DR
提出了一个大规模的视觉问答数据集Encyclopedic-VQA,包括涉及细粒度类别和实例详细属性的视觉问题,并配有来自Wikipedia的知识库作为支持每个答案的证据,可以通过检索增强模型实现对这些问答的准确回答。
Abstract
We propose
encyclopedic-vqa
, a large scale
visual question answering
(VQA) dataset featuring visual questions about detailed properties of
fine-g
→