BriefGPT.xyz
Ask
alpha
关键词
image-text matching
搜索结果 - 43
ECCV
图像文本匹配的交叉堆叠注意力
本文研究图像文本匹配问题,提出了一种使用交叉注意力机制的方法来发现包括图像区域和句子单词在内的全部潜在对齐,从而推断图像与文本之间的相似性,实验结果在 MS-COCO 和 Flickr30K 数据集上均表现为最先进的水平。
PDF
6 years ago
带有实例损失的双路径卷积图像 - 文本嵌入
本文提出了一种新的系统,以区分性地嵌入图像和文本到共享的视觉 - 文本空间,通过实例损失和端到端学习的双路径卷积网络来解决图像和文本匹配问题,并在 Flickr 30k 和 MSCOCO 上达到了与最先进方法相当的准确度,同时在基于语言的人
→
PDF
7 years ago
双重关注网络用于多模态推理与匹配
提出双重关注网络框架(Dual Attention Networks),应用于视觉和文本场景的多模态推理、比对任务,在 Visual Question Answering 和图片 - 文本比对任务中取得最新的优异表现。
PDF
8 years ago
Prev
Next