SIGIRApr, 2022

混合模态查询下的图像检索渐进式学习

TL;DR本论文介绍一种将语音和图像相结合进行图像检索的复杂检索方法,从而需要语义空间学习和跨模态融合,同时提出了自我监督适应权重策略以更好地检索,通过广泛的实验,表明该方法在 Fashion-IQ 和 Shoes 基准数据集上的召回率均比现有方法提高了 24.9%和 9.5%。