深度引导级联实例分割
提出了一种全新的混合任务级联(Hybrid Task Cascade,HTC)框架,基于实例分割级联的相互关系,在多个级别上逐步地学习可区分的特征并将互补特征整合在一起。相较于强基线,该方法在 MSCOCO 数据集上取得了 38.4 和 1.5 的提升,并在 COCO 2018 挑战目标检测任务中名列第一。
Jan, 2019
本文研究了密集滑动窗口实例分割的范例,将其作为 4D 张量预测任务,提出了一种称为 TensorMask 的通用框架,可以明确捕获几何信息和使预测更加准确,比现有的模型具有更好的性能表现。
Mar, 2019
通过部分监督学习方法,我们设计了一种训练模型,在只有少数类别的实例标注数据下,通过可微分裁剪和只使用 Groundtruth box 的方法,取得了 COCO 部分监督分割测试集的最佳表现,并发现了强大的 mask-head 泛化效应。
Apr, 2021
本文提出了一种新的旨在优化实例分割方法的卷积神经网络,该网络称为 BlendMask。BlendMask 可以有效地将实例级信息与语义信息相结合,并能够学习每个实例的注意力图,并且具有较快的推理速度,其可以与最先进的一阶段检测框架轻松集成,同时在相同训练计划下优于 Mask R-CNN,并可以在单个 1080Ti GPU 卡上以 25 FPS 评估时实现 34.2% mAP,其简单易用而且强大,可用于一系列实例化任务。
Jan, 2020
该论文介绍了一种基于距离变换的对象段表示方法和基于残差解卷积结构的对象掩码网络,实现了跨越边界框的对象分割;并将其整合到一个多任务网络级联框架中,学习了最终二进制对象掩码。实验表明,这种方法在目标生成和实例分割方面优于现有的技术。
Dec, 2016
本文提出了一种名为 SCNet 的体系结构,以确保训练时样本的 IoU 分布接近于推理时的分布,并进一步加强分类、检测和分割子任务之间的相互关系,以提高目标检测和实例分割的性能。
Dec, 2020
本文针对 Mask R-CNN 在场景文本检测与定位中面临的实际问题,提出了一种基于 MLP 解码器和实例感知掩模学习技术的方法,可以显著提高鲁棒性。同时提出了一种自适应标签分配方法,以应对比例和宽高比差异较大的实例问题。该方法在多个基准测试中展现了优异的性能。
Sep, 2021
本文提出了一种新的级联形状回归、动态注意力控制级联形状回归 (DAC-CSR) 的架构,用于非约束性人脸的鲁棒性面部关键点检测,包括人脸边界框细化、一般 CSR 和注意力控制 CSR。使用在线动态模型选择方法选择适当的面向域的 CSR 进行关键点的细化,DAC-CSR 的关键创新在于容错机制,使用模糊集样本加权进行注意控制域特定模型的训练。此外,我们提倡使用简单但有效的二维剖面面部生成器和上下文感知特征提取以更好地代表面部特征。实验结果表明,我们的 DAC-CSR 相对于现有技术具有更好的性能。
Nov, 2016
本文介绍了一种基于 Multi-task Network Cascades 的实例感知语义分割模型,该模型包含三个网络,分别用于区分实例、估算掩模和分类物体。该方法在 PASCAL VOC 数据集上达到了最先进的实例感知语义分割准确度,并且速度比之前的系统快两个数量级。
Dec, 2015