Oct, 2020

使用图形注意力学习图像文本匹配的双重语义关系

TL;DR本文提出了一种名为双重语义关系注意力网络 (DSRAN) 的新型图注意力方法,该方法主要由两个模块组成,分别进行不同层次的语义关系学习,从而提高图像文本匹配的准确性,并在 MS-COCO 和 Flickr30K 数据集上取得了显著优于以往方法的效果。