AAAINov, 2022

关于图像对于视觉增强关系抽取作用的分析

TL;DR本研究对视觉场景图的不准确信息对多模态关系提取的影响进行了分析,提出了一种基于 Transformer 的隐式精细多模态对齐的强基准方法,并通过实验表明了该方法的优越性。