CVPRApr, 2020

图结构网络用于图像文本匹配

TL;DR本文提出了一种新的基于图形结构匹配网络的图像 - 文本匹配方法,可以有效地解决对象、关系和属性的细粒度对应问题。实验结果表明,该方法在 Flickr30K 和 MSCOCO 数据集上相较于其他方法拥有高达近 7% 和 2% 的召回率提升。