AAAIJan, 2021

图文匹配的相似性推理与过滤

TL;DR本研究针对图像和文本匹配问题,提出了一种新颖的基于相似性图推理和注意力过滤的网络模型 (SGRAF),通过学习矢量化的相似性表示,利用局部和全局对齐信息进行关系感知相似度计算,并通过注意力机制选择性地整合对齐信息,实现了在 Flickr30K 和 MSCOCO 数据集上取得最新的最佳表现。