像素级分类不是语义分割所需的全部
本文提出了一种使用图像级别标签进行实例分割的新框架,其中分为两个阶段,分别是训练分类器生成伪掩模并在这些伪掩模上训练完全监督的 Mask R-CNN。在 PASCAL VOC 2012 数据集上进行实验,相对于现有方法说明主要性能提高。
Jul, 2019
在密集识别任务中,采用基于掩码预测的方法可以有效提高对异常情况的识别性能,该方法有效减少了边界处的假阳性响应。在无负面数据训练的情况下,该方法在 outlier-aware 语义分割任务中取得了最新的最佳性能,并在最近的 panoptic setup 中取得了进一步的性能提升。
Jan, 2023
提供一种新的架构 Mask2Former,该架构通过应用掩蔽注意力机制提取局部特征来解决多种类型的图像分割任务,包括全景分割、实体分割和语义分割,并且优于当前最佳的专门任务架构。
Dec, 2021
通过语义类别分割为基础,使用一种深度卷积回归网络来预测像素级的实例边界框,以实现语义实例分割,同时在训练过程中采用在线引导方法来进一步提高语义类别分割和实例级分割的效果,以最终在 PASCAL VOC 2012 数据集上取得最佳结果。
May, 2016
将传统的按像素分类的方法转变为基于掩码分类的方法,提出了 Mask2Anomaly 方法来解决异常分割、开放集语义分割和开放集全景分割问题,并引入了全局掩码注意力模块、掩码对比学习、掩码细化解决方案和基于掩码架构特性的未知实例挖掘。经过全面的定性和定量评估,我们展示了 Mask2Anomaly 在异常分割、开放集语义分割和开放集全景分割基准中取得了最新的最佳结果。
Sep, 2023
通过直接预测 3D 分割体积,我们展示了通用的图像分割架构轻松推广到视频分割领域,Mask2Former 在视频实例分割方面也取得了最先进的性能,同时在 YouTubeVIS-2019 和 YouTubeVIS-2021 上分别达到了 60.4 AP 和 52.6 AP。由于在图像分割方面的多才多艺,我们相信 Mask2Former 也能处理视频语义和全景分割,我们希望这将使最新的视频分割研究更易于使用并引起更多人对通用图像和视频分割架构的关注。
Dec, 2021
通过 S-Seg 模型,我们可以实现准确的像素级别标签分配,无需依赖于图像级别的 VL 模型、地面实况掩码和自定义分组编码器,并且可以在多个测试数据集上进行良好的泛化而无需进行微调。
Jan, 2024
本文提出了一种基于遮罩的分类方法 MASK Aggregation Network (MANet),可以更好的解决 few-shot semantic segmentation 中像素关系和对象关系的问题,并在 PASCAL-5^i 和 COCO-20^i 数据集上展现出可与最新像素方法相媲美的表现,证明了基于遮罩的分类方法作为 few-shot semantic segmentation 的一个替代基线方法的潜力。
Feb, 2022
通过在受限的可见类别上学习有标注遮罩,从而消除繁重注释负担,并在新颖的 unseen 类别上分割对象,部分监督实例分割是一个任务。本文提出了 ContrastMask,它在统一的像素级对比学习框架下,同时在可见和未知类别上学习掩模分割模型,提高了前景和背景的特征辨别率,促进了课程无关掩模分割模型的学习,在 COCO 数据集上的详尽实验证明了我们方法的优越性,胜过了之前的最新技术。
Mar, 2022
本文提出了一种新的旨在优化实例分割方法的卷积神经网络,该网络称为 BlendMask。BlendMask 可以有效地将实例级信息与语义信息相结合,并能够学习每个实例的注意力图,并且具有较快的推理速度,其可以与最先进的一阶段检测框架轻松集成,同时在相同训练计划下优于 Mask R-CNN,并可以在单个 1080Ti GPU 卡上以 25 FPS 评估时实现 34.2% mAP,其简单易用而且强大,可用于一系列实例化任务。
Jan, 2020