Nov, 2023

跨模态突出片段增强对齐网络:图像 - 文本检索

TL;DR通过降低非重要图片和文本片段的参与度,提高对重要片段的对齐相似性,本文介绍了一种新的跨模态突出片段增强对齐网络 (CPFEAN),该网络通过减少在对齐过程中无关区域的参与度并相对提高对齐的突出词,从而实现改进的检索准确性。与最先进的方法相比,在 MS-COCO 和 Flickr30K 数据集上进行了大量定量比较实验,结果显示本方法在 rSum 度量上的表现超过了现有方法约 5% 至 10%。