Apr, 2022

SegDiscover:基于无监督语义分割的视觉概念发现

TL;DRSegDiscover 是一个无人监督语义分割框架,通过从原始图像生成概念原语、在自监督预训练编码器的潜在空间中进行聚类以及神经网络平滑来发现语义上有意义的视觉概念。实验结果表明,该方法可以在单个图像中发现多个概念,并在包括 Cityscapes 和 COCO-Stuff 等复杂数据集上优于最先进的无监督方法。此方法还可以作为神经网络解释工具使用,通过比较不同编码器得出结果。