Oct, 2023

探索基于图推理的文本视觉问答中的稀疏空间关系

TL;DRTextVQA 中解决冗余关系推理的稀疏空间图网络 (SSGN) 被提出,通过空间感知关系修剪技术识别最重要的连接或消除冗余连接,在图学习中考虑物体 - 物体关系和 OCR-OCR 标记关系。实验证明 SSGN 在 TextVQA 和 ST-VQA 数据集上取得了令人满意的性能表现,并且某些可视化结果进一步证明了我们方法的可解释性。