Sep, 2022

FreeSeg:基于可解释对比语言-图像预训练的自由语义分割掩码

TL;DR本文提出了一种基于自然语言监督和预训练模型的FreeSeg框架,用于开放世界分割任务。它通过Image-Text Similarity Map(ITSM)获得自由掩码以进行语义分割,而不需要像传统方式一样像素级别的标注。该方法采用了平滑最小池化,局部标签和像素策略等关键技术,使性能超越当前先进水平。