CVPRMar, 2022

弱监督语义分割的跨语言图像匹配

TL;DR本文提出了一种基于 CLIP 模型的跨语言图像匹配框架 CLIMS,通过自然语言监督以激活更合理的物体区域和抑制相关的背景区域,并使用一组预定义的类相关背景文本描述来防止模型激活相关背景区域,在 PASCAL VOC2012 数据集上进行了充分的实验,该方法明显优于之前的最先进方法。