该论文介绍了一种使用预训练的图像 - 语言模型进行零样本学习的语义分割方法,将预训练模型中的视觉概念知识转化为分割区域的语义信息表示(即 segment tokens)并应用于视觉语义分割任务中。实验结果表明,该方法在多个公共基准数据集上可以达到与有监督训练方法相竞争的效果。
Jun, 2023
半监督语义分割领域伪标签方法的综述,从不同角度分类并介绍了特定应用领域的具体方法,还探讨了伪标签技术在医学图像分割中的应用,并提出了一些可行的未来研究方向来解决现有挑战。
Mar, 2024
本文提出了一种使用图像级别标签进行实例分割的新框架,其中分为两个阶段,分别是训练分类器生成伪掩模并在这些伪掩模上训练完全监督的 Mask R-CNN。在 PASCAL VOC 2012 数据集上进行实验,相对于现有方法说明主要性能提高。
Jul, 2019
TAG 是一种新颖的方法,用于在计算机视觉中进行无需训练、注释和指导的开放词汇语义分割,通过利用预训练模型以及来自外部数据库的类别标签检索,达到了在 PascalVOC、PascalContext 和 ADE20K 数据集上的开放词汇分割的最新成果。
我们提出了一个用于无监督语义分割的轻量级聚类框架,基于自监督视觉变换器的注意特征,通过将这些特征聚类成少量的聚类中心,我们能够将前景和背景的图像补丁分开成不同的组。我们的框架在无监督语义分割方面展示了很大的潜力,并在 PASCAL VOC 和 MS COCO 数据集上取得了最新的成果。
Nov, 2023
该研究提出了一种基于图像类别标签的新型递归粗到细语义分割框架,可用于图像分割和前景分割等任务,并且只需要一个标签来处理包含多类别对象的图像。
Dec, 2018
本文提出了一种利用视觉 - 语言模型 CLIP 生成粗略掩模并迭代互相调整支持和查询图片的掩模预测的框架,实验结果表明该方法不仅在 PASCAL-5i 和 COCO-20i 数据集上优于最先进的弱监督方法,还能够取得与最近的有监督方法相当甚至更好的结果,并且具有出色的野外图像和非常规类别的泛化能力。
Mar, 2023
介绍了在混乱场景中进行机器人感知的方法,在 Amazon 机器人挑战赛中获得胜利。作者提出了两种策略:一种是基于深度度量学习的方法,另一种是基于全监督语义分割方法的方法,并在数据集上进行了全面分析。两种方法都有良好效果,值得进一步研究。
Sep, 2017
本研究提出使用自我生成伪标签来捕捉未标注图像数据中的潜在信息,在同一张图像的不同数据增强生成的多个伪标签交集的一致性正则化过滤噪声伪标签,结合人工标注数据重新训练模型,并不断迭代,以此达到在复杂的零标签语义分割场景下进行广义分类的任务的最新最优结果。
Apr, 2021
提出了一种新的语义分割方法,只需要语义类别比例的大致信息,大大简化了数据标注过程,可行性更强,并取得了可比甚至更好的性能表现,为未来的语义分割研究提供了一个有前途的方向。
May, 2023