AAAIApr, 2021

基于特征分离和模式感知的短语定位图学习

TL;DR本文提出了一种基于图学习的新型短语图片对齐的框架,通过设计分离的图网络来区分场景图中的不同元素,添加干预策略并采用跨模态注意力网络来提高性能,实验结果表明模型在 Flickr30KEntities 和 ReferIt Game 基准数据集上达到了最先进的性能水平。