Oct, 2020

RUArt:一种新的以文本为中心的文本视觉问答解决方案

TL;DR本文提出了一种新的基于文本的VQA方法RUArt,它可以通过读取并理解图像中的文本、场景对象以及与之间的关系来回答给定问题,实验结果表明,该方法可以有效地探索文本的语境信息和挖掘文本与物体之间的稳定关系。