Apr, 2024
ViOCRVQA:视觉问答的新型基准数据集和理解图像中越南文本的视觉阅读器
ViOCRVQA: Novel Benchmark Dataset and Vision Reader for Visual Question Answering by Understanding Vietnamese Text in Images
Huy Quang Pham, Thang Kien-Bao Nguyen, Quan Van Nguyen, Dan Quang Tran, Nghia Hieu Nguyen...
TL;DR通过提供一个新的数据集 ViOCRVQA,这篇研究论文在 OCR-VQA 任务中引入了一种称为 VisionReader 的新方法,并对该数据集进行了实验,揭示了越南数据集所固有的挑战和困难。