CVPRJun, 2024

Frozen CLIP: 强大的骨干网络用于弱监督语义分割

TL;DR本文提出了基于 CLIP 模型的 WeCLIP 方法,用于弱监督语义分割。WeCLIP 将冻结的 CLIP 模型作为骨干网络进行语义特征提取,并设计了新的解码器来解释提取的语义特征进行最终预测。同时,我们利用冻结的骨干网络生成伪标签来训练解码器,并提出了一个校正模块来动态修正这些标签。我们的架构使得解码器和校正模块相互受益,以提高最终性能。大量实验证明了我们的方法在训练成本较低的情况下明显优于其他方法。此外,我们的 WeCLIP 方法在全监督设置下也取得了有希望的结果。