ECCVAug, 2022

草图胜千言:带文本和草图的图像检索

TL;DR本文介绍了一个基于文本及草图的图像检索模型,该模型称为 “TASK-former”,并采用了类似于 CLIP 的融合编码器的方法,众多实验表明,使用草图可以明显提高图像检索的召回率。