ICCVAug, 2023

利用文本监督进行参考图像分割

TL;DR我们提出了一种新颖的弱监督引用图像分割 (RIS) 框架,通过将目标定位问题在分类过程中进行正负文本表达的区分来利用 RIS 中已有的引用文本提供的信息来定位目标物体。我们的框架具有三个主要创新点:借助双向提示方法协调视觉和语言特征之间的域差异,通过校准方法减少噪声背景信息并提高响应图的正确性,通过正响应图选择策略从增强的响应图生成高质量的伪标签,用于训练 RIS 推理的分割网络。通过在四个基准数据集上的实验证明,我们的框架在与现有的全监督 RIS 方法相当的性能的同时,优于从相关领域调整的最新弱监督方法。