CVPRDec, 2021
面向图像检索的多模态查询嵌入算法
Embedding Arithmetic of Multimodal Queries for Image Retrieval
Guillaume Couairon, Matthieu Cord, Matthijs Douze, Holger Schwenk
TL;DR本文提供了一种检测基于多模态查询的图像检索任务的新数据集 SIMAT,使用图像 / 文本匹配预测器来评估基于图像 / 文本匹配策略训练的多模态嵌入空间的几何属性,并研究了利用预训练通用句子编码器(FastText,LASER 和 LaBSE)是否有益。