May, 2022

指称表达的弱监督分割

TL;DR本文提出基于 Transformer 模型的弱监督语义图像分割方法 Text Grounded Semantic Segmentation (TSEG),通过学习从图像级别的文本语句直接生成分割掩模,实现了从提及的表达式中进行图像分割,实验结果表明在 PhraseCut 和 RefCOCO 数据集上 TSEG 表现出了很好的弱监督语义分割效果,并且在 Pascal VOC 数据集的无监督语义分割任务中也具有很强的竞争力。