BriefGPT.xyz
Ask
alpha
关键词
image-sentence matching
搜索结果 - 2
MM
使用 Transformer 编码器进行跨模态检索的细粒度视觉文本对齐
通过词区匹配实现图像 - 句子匹配,本文提出了一种名为 TERAN 的新方法,在图像和句子的不同组件之间执行精细匹配,从而实现了跨模式检索,并在 MS-COCO 和 Flickr30k 数据集上获得了最先进的结果。
PDF
4 years ago
基于显著性引导的图像 - 句子匹配注意力网络
该研究旨在探讨图像和句子之间的匹配问题,提出了一种 Saliency-guided Attention Network 架构,包括视觉注意力和文本注意力模块,能够有效地提高多模态数据表示的准确性,并在 Flickr30K 和 MSCOCO
→
PDF
5 years ago
Prev
Next