Dec, 2022

CLIP也是高效分割器:一种文本驱动的弱监督语义分割方法

TL;DR利用Contrastive Language-Image Pre-training(简称CLIP)模型进行图像级标注的弱监督语义分割(WSSS)是一项具有挑战性的任务。本文提出了一种CLIP-ES框架,结合了softmax函数、基于文本的驱动策略和一种实时的基于注意力机制的亲和度(CAA)模块,以及CGL损失,来提高WSSS的效率和性能。