BriefGPT.xyz
Ask
alpha
关键词
ms-coco and flickr30k datasets
搜索结果 - 2
ECCV
重新审视跨模态检索
本文提出了一种交叉模态检索系统,利用图像和文本编码,实现了同时检索模态的功能,避免了需要为每个模态使用不同网络的缺点。在所使用的知识中,本文是第一篇采用单一网络和融合的图像 - 文本嵌入进行跨模态检索的工作。在 MS-COCO 和 Flic
→
PDF
6 years ago
ECCV
图像文本匹配的交叉堆叠注意力
本文研究图像文本匹配问题,提出了一种使用交叉注意力机制的方法来发现包括图像区域和句子单词在内的全部潜在对齐,从而推断图像与文本之间的相似性,实验结果在 MS-COCO 和 Flickr30K 数据集上均表现为最先进的水平。
PDF
6 years ago
Prev
Next