因果无监督语义分割
我们提出了一个用于无监督语义分割的轻量级聚类框架,基于自监督视觉变换器的注意特征,通过将这些特征聚类成少量的聚类中心,我们能够将前景和背景的图像补丁分开成不同的组。我们的框架在无监督语义分割方面展示了很大的潜力,并在 PASCAL VOC 和 MS COCO 数据集上取得了最新的成果。
Nov, 2023
我们提出了一个基于自我监督的完全自我监督语义分割框架,其中包括金字塔全局引导培训策略和上下文感知嵌入模块等组成部分,显著改善了 COCO-Stuff 数据集上物品和物品分类的性能。
Feb, 2022
本文提出了一种自监督的像素表示学习方法,通过使用从图像中提取的视觉概念(例如部件、物体和场景等具有语义意义的像素组)实现语义分割,评估了在三个数据集上学习到的像素嵌入和视觉概念。作者的实验结果表明,该方法在非监督语义分割方面取得了持续和显著的改进,并且视觉概念可以揭示图像数据集的洞见。
Mar, 2022
SegDiscover 是一个无人监督语义分割框架,通过从原始图像生成概念原语、在自监督预训练编码器的潜在空间中进行聚类以及神经网络平滑来发现语义上有意义的视觉概念。实验结果表明,该方法可以在单个图像中发现多个概念,并在包括 Cityscapes 和 COCO-Stuff 等复杂数据集上优于最先进的无监督方法。此方法还可以作为神经网络解释工具使用,通过比较不同编码器得出结果。
Apr, 2022
本文提出了一种基于像素特征学习的数据驱动的无监督分层语义分割方法,使用同一图像的多视角协同分割来启动特征学习,加入粗细层次间的聚类变换器以确保组织层次间的语义一致性,该方法被称作 'Hierarchical Segment Grouping',在五个主流目标和场景测评基准上表现良好。
Apr, 2022
本文提出了一种通用的半监督语义分割框架,旨在在各种应用领域实现更低的注释和部署成本,并通过像素感知熵正则化的特征对齐目标来最小化有监督以及无监督损失,以实现在多个领域中都能使用单一模型,利用少量标记实现性能提升,同时可以处理不同领域的标签空间不同的问题。
Nov, 2018
该研究提出了一种分阶段的自我训练框架,使用伪掩模的统计信息来降低预测概率的不确定性以及通过多任务模型在一定程度上强制执行分割一致性,从而实现半监督语义分割的性能并表现出与现有方法相当。
Dec, 2020
本文提出了一种半监督学习的方法,即自我训练范式,通过用标注数据训练教师模型并在大量未标注数据上生成伪标签,以较少的监督实现像素级准确模型,并在 Cityscapes,CamVid 和 KITTI 数据集上取得了最优表现,同时,在具有挑战性的跨域泛化任务上表现更佳,最后,为了减轻大量伪标签带来的计算负担,提出了一种快速训练计划来加速分割模型的训练。
Apr, 2020
本文提出了一种因果推断框架,结合结构因果模型和上下文调整方法以纠正语义分割中的误导性上下文因素,使用图像级标签生成更好的像素级伪掩模,并将其用作后续分割模型的更好伪造地面实况。
Sep, 2020
本文提出了一个像素级聚类框架,用于将图像分割成区域,而无需使用地面真值标注。该框架包括特征嵌入模块、特征统计计算模块、图像重建和超像素分割,以实现准确的无监督分割。此外,我们提出了一种训练策略,利用每个超像素内部一致性、相邻超像素间的相似性 / 差异性和图像结构相似性。我们还提出了一种后处理方法,以避免由基于超像素的损失引起的过分分割。最后,我们扩展了所提方法用于无监督语义分割。通过在三个公开数据集上进行实验,我们证明了所提框架的有效性。实验结果表明,所提框架优于先前的最先进方法。
Oct, 2023