Feb, 2021

多模式查询图像检索时传递主题语义和指示区域信息

TL;DR本文提出了一种新的多模态查询图像检索系统,并将用户同时使用自然语言和鼠标轨迹来表达所需目标图像的特征,本系统在现有图像检索模型的基础上进行了简单的修改,以更好地考虑所提供的空间引导。实验结果表明,本模型能够有效地利用空间引导,相比于仅使用文本查询的系统,本模型能提供更准确的图像检索结果。