Jun, 2021

基于逐层分步对齐的图像-文本匹配网络

TL;DR本文提出了一种逐步分层对齐网络 (SHAN) 的图像 - 文本匹配方法,将图像 - 文本匹配分解成多步跨模态推理过程以捕捉层次化的细粒度相关性,并在两个基准数据集上进行了实验。