一次分割，实时全景分割的探索

CVPRMar, 2023

You Only Segment Once: Towards Real-Time Panoptic Segmentation

PDF

Jie Hu, Linyan Huang, Tianhe Ren, Shengchuan Zhang, Rongrong Ji...

TL;DR提出了实时全景分割框架 YOSO，通过动态卷积预测掩模，采用特征金字塔汇聚器进行特征图提取，并采用可分离动态解码器进行全景核生成，具有较高的效率和精度，是首个能够与最先进模型相媲美的实时全景分割框架。

Abstract

In this paper, we propose yoso, a real-time panoptic segmentation framework. →

yoso real-time panoptic segmentation dynamic convolution feature pyramid aggregator

发现论文，激发创造

基于密集检测的实时全景分割

本文提出了一种基于密集检测和全局自注意力机制的新型单次全景分割网络，该网络采用参数自由的掩码构建方法，大大降低了计算复杂度，实现了高效的实时性能，并在 Cityscapes 和 COCO 基准测试上取得了很好的效果。

Dec, 2019

YOLACT++：更好的实时实例分割

提出了一种实时实例分割的全卷积模型，通过生成原型掩模和预测实例掩模系数两个并行子任务，使用线性组合的方法得到实例掩模。通过使用改进的锚点尺度和纵横比进行优化，同时引入新的快速掩模回归分支以及快速 NMS 算法，使得该模型在实时情况下能够接近于最先进的方法。

Dec, 2019

YOLACT：实时实例分割

本研究提出了一种利用生成一组原型掩码和预测每个实例掩码系数的并行子任务的方法，进而实现在一台 Titan Xp 上每秒 33.5 帧且仅在一台 GPU 上进行训练即可在 MS COCO 上达到 29.8 mAP 的实时实例分割的全卷积模型，并且进一步通过分析原型的紧急行为和提出一个只有 12 ms 更快的可替换的 Fast NMS 来优化模型。

Apr, 2019

Q-YOLOP：面向全景驾驶感知的量化感知 You Only Look Once

通过提出一种高效的量化感知网联驾驶模型（Q- YOLOP）来实现目标检测、可行驶区域分割、车道线分割，其采用高效层聚合网络（ELAN）作为主干，并在 BDD100K 数据集上具有在 [email protected] 为 0.622 的最新性能和分割的 mIoU 为 0.612，同时保持较低的计算和内存要求。

Jul, 2023

YOLOP: 一次观测全景驾驶感知

我们提出了一种全景驾驶感知网络（YOLOP），它可以同时执行交通物体检测、可驾驶区域分割和车道检测三个任务，并在嵌入式设备 Jetson TX2 上实现了实时性的高精度表现。

Aug, 2021

仅需一次观看：一种用于实时时空动作定位的统一 CNN 架构

本研究提出了一种 YOWO 统一的 CNN 结构，用于视频流中的实时时空动作定位，它是一个单阶段架构，具有提取同时预测时间和空间信息，并直接从视频剪辑中预测边界框和动作概率的特点。

Nov, 2019

无缝场景分割

本研究提出了一种基于 CNN 的新型架构，可以进行端到端的训练，以提供无缝的场景分割结果。该网络结构采用了一种新颖的分割头，将由特征金字塔网络生成的多尺度特征与由轻量级 DeepLab 模块传递的上下文信息进行了无缝整合，从而预测一致的语义分割和检测结果。此外，研究人员还提出了一种替代 panoptic 度量的方法，克服了评估非实例类别时的局限性。通过在三个具有挑战性的街景数据集上测试，即 Cityscapes、Indian Driving Dataset 和 Mapillary Vistas，我们的网络架构取得了最先进的结果。

May, 2019

单次全景分割

本文提出了一种全新的端到端单次方法，可以将可计数的物体实例 (事物) 以及背景区域 (物料) 分段成为一个几乎达到视频帧率的非重叠全景分割。

Nov, 2019

快速全景分割网络

本研究提出了一种名为 Fast Panoptic Segmentation Network（FPSNet）的端到端网络，将全景任务转化为自定义的密集像素分类任务以实现像素级分类和实例识别，在 Cityscapes 和 Pascal VOC 数据集上取得了更好或类似的全景分割性能，比现有的全景分割方法更快。

Oct, 2019

具有鉴别方向地图的实时实例分割

本文提出了一种实时实例分割框架 OrienMask，采用一种名为欧几里得方向的方法，通过添加一个面膜头来预测一些判别性方向地图，这些地图用于构造实例掩码，该方法在保持竞争力的准确性的情况下，已在实时条件下的测试达到 42.7fps.

Jun, 2021