一次分割,实时全景分割的探索
本文提出了一种基于密集检测和全局自注意力机制的新型单次全景分割网络,该网络采用参数自由的掩码构建方法,大大降低了计算复杂度,实现了高效的实时性能,并在 Cityscapes 和 COCO 基准测试上取得了很好的效果。
Dec, 2019
提出了一种实时实例分割的全卷积模型,通过生成原型掩模和预测实例掩模系数两个并行子任务,使用线性组合的方法得到实例掩模。通过使用改进的锚点尺度和纵横比进行优化,同时引入新的快速掩模回归分支以及快速 NMS 算法,使得该模型在实时情况下能够接近于最先进的方法。
Dec, 2019
本研究提出了一种利用生成一组原型掩码和预测每个实例掩码系数的并行子任务的方法,进而实现在一台 Titan Xp 上每秒 33.5 帧且仅在一台 GPU 上进行训练即可在 MS COCO 上达到 29.8 mAP 的实时实例分割的全卷积模型,并且进一步通过分析原型的紧急行为和提出一个只有 12 ms 更快的可替换的 Fast NMS 来优化模型。
Apr, 2019
通过提出一种高效的量化感知网联驾驶模型(Q- YOLOP)来实现目标检测、可行驶区域分割、车道线分割,其采用高效层聚合网络(ELAN)作为主干,并在 BDD100K 数据集上具有在 [email protected] 为 0.622 的最新性能和分割的 mIoU 为 0.612,同时保持较低的计算和内存要求。
Jul, 2023
我们提出了一种全景驾驶感知网络(YOLOP),它可以同时执行交通物体检测、可驾驶区域分割和车道检测三个任务,并在嵌入式设备 Jetson TX2 上实现了实时性的高精度表现。
Aug, 2021
本研究提出了一种 YOWO 统一的 CNN 结构,用于视频流中的实时时空动作定位,它是一个单阶段架构,具有提取同时预测时间和空间信息,并直接从视频剪辑中预测边界框和动作概率的特点。
Nov, 2019
本研究提出了一种基于 CNN 的新型架构,可以进行端到端的训练,以提供无缝的场景分割结果。该网络结构采用了一种新颖的分割头,将由特征金字塔网络生成的多尺度特征与由轻量级 DeepLab 模块传递的上下文信息进行了无缝整合,从而预测一致的语义分割和检测结果。此外,研究人员还提出了一种替代 panoptic 度量的方法,克服了评估非实例类别时的局限性。通过在三个具有挑战性的街景数据集上测试,即 Cityscapes、Indian Driving Dataset 和 Mapillary Vistas,我们的网络架构取得了最先进的结果。
May, 2019
本研究提出了一种名为 Fast Panoptic Segmentation Network(FPSNet)的端到端网络,将全景任务转化为自定义的密集像素分类任务以实现像素级分类和实例识别,在 Cityscapes 和 Pascal VOC 数据集上取得了更好或类似的全景分割性能,比现有的全景分割方法更快。
Oct, 2019
本文提出了一种实时实例分割框架 OrienMask,采用一种名为欧几里得方向的方法,通过添加一个面膜头来预测一些判别性方向地图,这些地图用于构造实例掩码,该方法在保持竞争力的准确性的情况下,已在实时条件下的测试达到 42.7fps.
Jun, 2021