ICCVAug, 2017

具有潜在共同关注的身份感知文本 - 视觉匹配

TL;DR本文提出了一个基于身份感知的两阶段框架,通过新颖的 CMCE 损失函数和潜在的共同注意机制来提高文本 - 视觉匹配的准确性,实验证明其相对于先前的最先进方法取得了显著的性能改进。