ECCVAug, 2022

CODER: 用于图像 - 文本检索的耦合多样性感知动量对比学习

TL;DR本文提出了一种基于对比学习的新型跨模态表征方法 Coupled Diversity-Sensitive Momentum Constrastive Learning(CODER),通过引入动态字典和适应性负对权重,使用实例级嵌入和概念级描述符提高跨模态表征,经过对 MSCOCO 和 Flicker30K 数据集的大量实验,CODER 明显优于当前基准方法。