单次实例分割
本文提出了一种名为 $\textit {cluttered Omniglot}$ 的新数据集并使用基线结构来解决一次性分割问题,结果表明在这种视觉搜索任务中,检测和分割是相互交织的问题,解决其中一个问题有助于解决另一个问题。为此,我们引入了 $ extit {MaskNet}$,这是一种改进的模型,它关注多个候选位置,生成分割建议来遮挡背景杂物并在分割对象中进行选择。发现这种基于对象检测和前景分割的迭代优化的图像识别模型可能提供了一种处理高度混杂场景的方法。
Mar, 2018
我们提出了一个简单、灵活、通用的物体实例分割框架。此方法名为 Mask R-CNN,通过在现有的边界框识别分支上添加一个预测对象掩模的分支,同时高效地检测图像中的物体并生成每个实例的高质量分割掩模。该方法简单易用,可快速训练,并且在 COCO 挑战赛的三个跟踪任务中均取得最佳结果,在实例分割、边界框目标检测和人体关键点检测方面均表现优异,是一个强大的基线模型。
Mar, 2017
该研究提出了一种新的部分监督训练范式和权重转移函数,使得可以在仅有少量掩模注释的情况下,使用来自 Visual Genome 数据集的框注释和 COCO 数据集中 80 个类别的掩模注释,训练出可以检测和分割 3000 个视觉概念的 Mask R-CNN 模型,在 COCO 数据集上进行了实验评估。这是实现广泛理解视觉世界的目标实例分割模型的第一步。
Nov, 2017
本论文提出了一个新的计算机视觉任务,名为视频实例分割,目标是同时检测、分割和跟踪视频帧中的实例。为了便于研究,提出了一个大规模基准数据集 YouTube-VIS 和一个新算法 MaskTrack R-CNN。实验表明,这个算法优于强基线,并为未来研究提供了启示。
May, 2019
提出了一种新的、非常简单的实例分割方法,通过引入 “实例类别” 概念,将实例掩码分割转化为可分类问题。实验结果表明,该方法具有较强的性能和简单的框架,可以作为许多实例级别识别任务的基准。
Dec, 2019
本研究中我们试图通过应对一次训练样例被限制为 1 的单独目标检测问题,丰富目标检测类别,并引入了匹配 - FCOS 网络和结构感知关系模块等模型以及新颖的训练策略进行探究,旨在最终消除对支持图像的微调需要,结果在多个数据集上始终超过同类现有技术,进而分类属于基于深度学习和 Faster R-CNN 的无锚点检测技术。
May, 2020
本文提出了一种使用图像级别标签进行实例分割的新框架,其中分为两个阶段,分别是训练分类器生成伪掩模并在这些伪掩模上训练完全监督的 Mask R-CNN。在 PASCAL VOC 2012 数据集上进行实验,相对于现有方法说明主要性能提高。
Jul, 2019
我们提出了一种新的零样本目标实例分割任务,并提出了一种用于解决此挑战的方法,该方法包括零样本检测器,语义掩模头,背景感知 RPN 和同步背景策略,并在基于 MS-COCO 数据集的新基准测试中取得了良好的性能,这将成为零样本目标实例分割领域未来研究的坚实基础。
Apr, 2021
介绍了一种名为 ShapeMask 的解决利用对象的形状中间概念来解决在实例分割中应用于新类别的问题的方法。与现有方法相比,该模型通过学习形状先验和实例嵌入来捕获对象形状和外观信息,并取得了 6.4 到 9.4 的 AP 值提高。
Apr, 2019
介绍一种新的角度来处理实例分割任务:引入 “实例类别” 的概念,其根据实例的位置给每个像素分配类别,从而提出了 Segmenting Objects by Locations(SOLO)。我们的方法消除了后处理分组或边界框检测的需求,并以在速度和准确性方面都取得了最新成果,同时比现有方法相对简单。
Jun, 2021