深度引导级联实例分割

CVPRNov, 2019

Deeply Shape-guided Cascade for Instance Segmentation

Hao Ding, Siyuan Qiao, Alan Yuille, Wei Shen

TL;DR本文提出了一种深度形状引导级联算法 (DSC)，通过引入三种关键组件，即初始形状指导、显式形状指导和隐式形状指导，使掩模分割和边界框检测形成双向关系，进而提高了实例分割的性能。实验结果表明，DSC 较当前最先进的实例分割算法 Hybrid Task Cascade (HTC) 提升明显，在 COCO 测试中获得了 51.8 的 box AP 和 45.5 的 mask AP。

Abstract

The key to a successful cascade architecture for precise instance segmentation is to fully leverage the relationship between bounding box detection and mask segmentation across multiple stages. Although modern

instance segmentation cascade architecture mask segmentation bounding box detection shape guidance

发现论文，激发创造

混合任务级联用于实例分割

提出了一种全新的混合任务级联（Hybrid Task Cascade，HTC）框架，基于实例分割级联的相互关系，在多个级别上逐步地学习可区分的特征并将互补特征整合在一起。相较于强基线，该方法在 MSCOCO 数据集上取得了 38.4 和 1.5 的提升，并在 COCO 2018 挑战目标检测任务中名列第一。

Jan, 2019

TensorMask: 基于张量的密集物体分割基础

本文研究了密集滑动窗口实例分割的范例，将其作为 4D 张量预测任务，提出了一种称为 TensorMask 的通用框架，可以明确捕获几何信息和使预测更加准确，比现有的模型具有更好的性能表现。

Mar, 2019

口罩头结构对新类别分割的惊人影响

通过部分监督学习方法，我们设计了一种训练模型，在只有少数类别的实例标注数据下，通过可微分裁剪和只使用 Groundtruth box 的方法，取得了 COCO 部分监督分割测试集的最佳表现，并发现了强大的 mask-head 泛化效应。

Apr, 2021

BlendMask: 自顶向下与自底向上相遇的实例分割

本文提出了一种新的旨在优化实例分割方法的卷积神经网络，该网络称为 BlendMask。BlendMask 可以有效地将实例级信息与语义信息相结合，并能够学习每个实例的注意力图，并且具有较快的推理速度，其可以与最先进的一阶段检测框架轻松集成，同时在相同训练计划下优于 Mask R-CNN，并可以在单个 1080Ti GPU 卡上以 25 FPS 评估时实现 34.2％ mAP，其简单易用而且强大，可用于一系列实例化任务。

Jan, 2020

边界感知实例分割

该论文介绍了一种基于距离变换的对象段表示方法和基于残差解卷积结构的对象掩码网络，实现了跨越边界框的对象分割；并将其整合到一个多任务网络级联框架中，学习了最终二进制对象掩码。实验表明，这种方法在目标生成和实例分割方面优于现有的技术。

Dec, 2016

SCNet：用于实例分割的训练推理样本一致性

本文提出了一种名为 SCNet 的体系结构，以确保训练时样本的 IoU 分布接近于推理时的分布，并进一步加强分类、检测和分割子任务之间的相互关系，以提高目标检测和实例分割的性能。

Dec, 2020

Mask 是你所需要的：重新思考 Mask R-CNN 用于密集和任意形状场景文本检测

本文针对 Mask R-CNN 在场景文本检测与定位中面临的实际问题，提出了一种基于 MLP 解码器和实例感知掩模学习技术的方法，可以显著提高鲁棒性。同时提出了一种自适应标签分配方法，以应对比例和宽高比差异较大的实例问题。该方法在多个基准测试中展现了优异的性能。

Sep, 2021

利用训练数据增强和模糊集样本加权的动态注意力控制级联形状回归

本文提出了一种新的级联形状回归、动态注意力控制级联形状回归 (DAC-CSR) 的架构，用于非约束性人脸的鲁棒性面部关键点检测，包括人脸边界框细化、一般 CSR 和注意力控制 CSR。使用在线动态模型选择方法选择适当的面向域的 CSR 进行关键点的细化，DAC-CSR 的关键创新在于容错机制，使用模糊集样本加权进行注意控制域特定模型的训练。此外，我们提倡使用简单但有效的二维剖面面部生成器和上下文感知特征提取以更好地代表面部特征。实验结果表明，我们的 DAC-CSR 相对于现有技术具有更好的性能。

Nov, 2016

多任务网络级联实例感知语义分割

本文介绍了一种基于 Multi-task Network Cascades 的实例感知语义分割模型，该模型包含三个网络，分别用于区分实例、估算掩模和分类物体。该方法在 PASCAL VOC 数据集上达到了最先进的实例感知语义分割准确度，并且速度比之前的系统快两个数量级。

Dec, 2015

伪掩模增强的物体检测

本文提出一种基于弱监督实例级别分割网络的伪真实目标掩模递归估计和自顶向下分割反馈来提高目标检测性能的方法。

Mar, 2018