像素级分类不是语义分割所需的全部

Jul, 2021

像素级分类不是语义分割所需的全部

Per-Pixel Classification is Not All You Need for Semantic Segmentation

Bowen Cheng, Alexander G. Schwing, Alexander Kirillov

TL;DR提出了基于掩膜分类模型的方法 MaskFormer，通过预测一组二进制掩膜，使语义分割和全景分割任务的解决变得统一，并在各项指标上实现了优秀的实验结果。

Abstract

Modern approaches typically formulate semantic segmentation as a per-pixel classification task, while instance-level segmentation is handled with an alternative →

mask classification semantic segmentation instance-level segmentation unified model empirical results

发现论文，激发创造

基于图像级监督学习的实例分割：口罩在哪里？

本文提出了一种使用图像级别标签进行实例分割的新框架，其中分为两个阶段，分别是训练分类器生成伪掩模并在这些伪掩模上训练完全监督的 Mask R-CNN。在 PASCAL VOC 2012 数据集上进行实验，相对于现有方法说明主要性能提高。

Jul, 2019

掩码级别识别对于异常感知分割的优势

在密集识别任务中，采用基于掩码预测的方法可以有效提高对异常情况的识别性能，该方法有效减少了边界处的假阳性响应。在无负面数据训练的情况下，该方法在 outlier-aware 语义分割任务中取得了最新的最佳性能，并在最近的 panoptic setup 中取得了进一步的性能提升。

Jan, 2023

掩模关注掩模变换器用于通用图像分割

提供一种新的架构 Mask2Former，该架构通过应用掩蔽注意力机制提取局部特征来解决多种类型的图像分割任务，包括全景分割、实体分割和语义分割，并且优于当前最佳的专门任务架构。

Dec, 2021

跨越类别级别和实例级别的语义图像分割

通过语义类别分割为基础，使用一种深度卷积回归网络来预测像素级的实例边界框，以实现语义实例分割，同时在训练过程中采用在线引导方法来进一步提高语义类别分割和实例级分割的效果，以最终在 PASCAL VOC 2012 数据集上取得最佳结果。

May, 2016

Mask2Anomaly：面具变换器用于通用开放集分割

将传统的按像素分类的方法转变为基于掩码分类的方法，提出了 Mask2Anomaly 方法来解决异常分割、开放集语义分割和开放集全景分割问题，并引入了全局掩码注意力模块、掩码对比学习、掩码细化解决方案和基于掩码架构特性的未知实例挖掘。经过全面的定性和定量评估，我们展示了 Mask2Anomaly 在异常分割、开放集语义分割和开放集全景分割基准中取得了最新的最佳结果。

Sep, 2023

Mask2Former 用于视频实例分割

通过直接预测 3D 分割体积，我们展示了通用的图像分割架构轻松推广到视频分割领域，Mask2Former 在视频实例分割方面也取得了最先进的性能，同时在 YouTubeVIS-2019 和 YouTubeVIS-2021 上分别达到了 60.4 AP 和 52.6 AP。由于在图像分割方面的多才多艺，我们相信 Mask2Former 也能处理视频语义和全景分割，我们希望这将使最新的视频分割研究更易于使用并引起更多人对通用图像和视频分割架构的关注。

Dec, 2021

探索简化开放词汇语义分割

通过 S-Seg 模型，我们可以实现准确的像素级别标签分配，无需依赖于图像级别的 VL 模型、地面实况掩码和自定义分组编码器，并且可以在多个测试数据集上进行良好的泛化而无需进行微调。

Jan, 2024

少样本语义分割通过蒙版聚合

本文提出了一种基于遮罩的分类方法 MASK Aggregation Network (MANet)，可以更好的解决 few-shot semantic segmentation 中像素关系和对象关系的问题，并在 PASCAL-5^i 和 COCO-20^i 数据集上展现出可与最新像素方法相媲美的表现，证明了基于遮罩的分类方法作为 few-shot semantic segmentation 的一个替代基线方法的潜力。

Feb, 2022

对比度掩蔽：对每样东西进行分割的对比学习

通过在受限的可见类别上学习有标注遮罩，从而消除繁重注释负担，并在新颖的 unseen 类别上分割对象，部分监督实例分割是一个任务。本文提出了 ContrastMask，它在统一的像素级对比学习框架下，同时在可见和未知类别上学习掩模分割模型，提高了前景和背景的特征辨别率，促进了课程无关掩模分割模型的学习，在 COCO 数据集上的详尽实验证明了我们方法的优越性，胜过了之前的最新技术。

Mar, 2022

BlendMask: 自顶向下与自底向上相遇的实例分割

本文提出了一种新的旨在优化实例分割方法的卷积神经网络，该网络称为 BlendMask。BlendMask 可以有效地将实例级信息与语义信息相结合，并能够学习每个实例的注意力图，并且具有较快的推理速度，其可以与最先进的一阶段检测框架轻松集成，同时在相同训练计划下优于 Mask R-CNN，并可以在单个 1080Ti GPU 卡上以 25 FPS 评估时实现 34.2％ mAP，其简单易用而且强大，可用于一系列实例化任务。

Jan, 2020