Apr, 2024

ViOCRVQA:视觉问答的新型基准数据集和理解图像中越南文本的视觉阅读器

TL;DR通过提供一个新的数据集 ViOCRVQA,这篇研究论文在 OCR-VQA 任务中引入了一种称为 VisionReader 的新方法,并对该数据集进行了实验,揭示了越南数据集所固有的挑战和困难。