Nov, 2023

SemiVL: 基于视觉 - 语言引导的半监督语义分割

TL;DRSemiVL 是一种结合了视觉 - 语言模型的丰富先验知识与半监督语义分割的方法,通过空间微调策略和语言引导解码器的设计,以及提供类别定义的语言指导,实现了更好的语义决策边界。在 4 个语义分割数据集上进行评估时,SemiVL 明显优于以前的半监督方法,例如,在带有 232 个已注释图像的 COCO 上,mIoU 提高了 + 13.5,在带有 92 个标签的 Pascal VOC 上,mIoU 提高了 + 6.1。