Sep, 2023

句法树约束的图网络用于视觉问答

TL;DR我们提出了一种基于语法树约束图网络(STCGN)的视觉问答模型,该模型能够从问题中提取语法树并获取更精确的语法信息,通过实体消息传递和语法树实现对视觉问题的理解和特征提取,在 VQA2.0 数据集的广泛实验中证明了我们提出模型的优越性。