ACLMay, 2021

学习关系对准以进行校准的跨模态检索

TL;DR本论文提出一种新的 Intra-modal Self-attention Distance(ISD)度量方法和 Inter-modal Alignment on Intra-modal Self-attentions(IAIS)正则化训练方法,旨在通过 ISD 度量语言和视觉关系之间的语义距离并通过 IAIS 进行交叉训练,从而提高 Flickr30k 和 MS COCO 数据集中的跨模态检索性能。