CVPRDec, 2021

面向图像检索的多模态查询嵌入算法

TL;DR本文提供了一种检测基于多模态查询的图像检索任务的新数据集 SIMAT,使用图像 / 文本匹配预测器来评估基于图像 / 文本匹配策略训练的多模态嵌入空间的几何属性,并研究了利用预训练通用句子编码器(FastText,LASER 和 LaBSE)是否有益。