路径聚合网络用于实例分割
使用金字塔注意力网络 (PAN) 进行语义分割,通过特征金字塔注意力模块和全局注意力上采样模块提取精确的密集特征,优于现有方法,可达到 PASCAL VOC 2012 和 Cityscapes 数据集的最高精度 mIoU 84.0%。
May, 2018
我们提出了一种端到端的网络,用于连接全景分割的训练和推理管道,通过使用密集实例亲和力来捕获像素对属于相同实例的概率,并与 ResNet-50 骨干网络配合使用,实现了对 Cityscapes 和 COCO 数据集的新记录。
Jan, 2020
本文提出了一种基于双向学习流程和插拔式遮挡处理算法的深度全景分割方案,用于同时执行前景实例的实例分割和背景物品的语义分割,并能有效地处理不同物体实例之间的遮挡问题。在 COCO 全景基准测试中,实验结果验证了我们所提出的方法的有效性。
Mar, 2020
该研究讨论了深度学习技术在联合声音信号分类和定位网络中的应用。通过引入特征聚合技术,研究结果表明将特征聚合应用于声音检测神经网络可以提高其性能,特别是在到达方向回归上。
Oct, 2023
本文介绍了一种基于 Weakly-supervised instance segmentation 方法、称为 Label-PEnet 的分割网络,能够从图像级标签逐步转化到像素级标签,主要包含四个模块:多标签分类、目标检测、实例细化和实例分割,并通过 Curriculum Learning 策略将标签从高层次图像逐渐泛化到低层次像素。我们同时设计了一种 Proposal Calibration 模块来验证分类网络找到识别对象部件的关键像素的能力。实验结果表明,相比现有方法,Label-PEnet 性能更好,甚至可以达到全监督方法的水平。
Oct, 2019
提出了一种用于全景分割的单一网络方法,该方法将联合训练的语义分割和实例分割网络的预测结果结合起来使用启发式方法,通过对 ResNet-50 特征提取器的共享来加快训练速度并提高内存效率,并使用 Mask R-CNN 类型的架构进行实例分割和增加 Pyramid Pooling 模块进行语义分割。在 COCO 和 Mapillary 联合识别挑战赛 2018 中,我们的方法在 Mapillary Vistas 验证集上获得了 17.6 的 PQ 分数,在 COCO 测试开发集上获得了 27.2 的 PQ 分数。
Sep, 2018
本文提出了一种高效准确的任意形状文本检测器 Pixel Aggregation Network (PAN),它配备了低计算成本的分割头和可学习的后处理,其中分割头由 Feature Pyramid Enhancement Module (FPEM) 和 Feature Fusion Module (FFM) 组成。通过预测相似向量准确地聚合文本像素的像素聚合 (PA) 实现可学习后处理。同时,该方法在几个标准基准测试中取得了优异的表现。
Aug, 2019
该论文提出了一种新型的端对端网络,能够高效地预测实例和物体分割,并引入了一种新的空间排名模块以处理预测实例之间的遮挡问题。在 COCO Panoptic 基准测试上取得了可喜的成果。
Mar, 2019
本文提出了一种用于全景分割的深度神经网络,将语义分割与实例分割任务联合起来,从而在单次计算中为输入图像的每个像素提供类标签和唯一对象标识符,并且通过增强信息共享和合并启发式方法,单个网络的性能提高,如在 Cityscapes 上可获得 45.9 的 PQ 分数。
Feb, 2019
本文提出了一种统一的全景分割网络(UPSNet),通过在单个骨干残差网络上设计基于可变卷积的语义分割头和基于 Mask R-CNN 的实例分割头,同时解决这两个子任务,并引入了一个无需参数的全景头来通过像素级分类解决全景分割,可帮助更好地解决语义分割和实例分割之间的冲突。此外,具有处理不同实例数量挑战的功能,可以端到端地在底部模块中反向传播。实验结果表明,UPSNet 可以实现最先进的性能,并具有更快的推理速度。
Jan, 2019