BriefGPT.xyz
Mar, 2018
图像文本匹配的交叉堆叠注意力
Stacked Cross Attention for Image-Text Matching
HTML
PDF
Kuang-Huei Lee, Xi Chen, Gang Hua, Houdong Hu, Xiaodong He
TL;DR
本文研究图像文本匹配问题,提出了一种使用交叉注意力机制的方法来发现包括图像区域和句子单词在内的全部潜在对齐,从而推断图像与文本之间的相似性,实验结果在 MS-COCO 和 Flickr30K 数据集上均表现为最先进的水平。
Abstract
In this paper, we study the problem of
image-text matching
. Inferring the
latent semantic alignment
between objects or other salient stuffs (e.g. snow, sky, lawn) and the corresponding words in sentences allows t
→