基于示例的开放式全景分割网络
本文提出了一种基于贝叶斯框架和模拟退火优化的图像划分采样算法,基于已知物体类别的目标检测器输出,实现了在开放集条件下分割所有已知和未知目标类别的实例分割方法,该方法在已知类别和未知类别上均有较好表现并且与监督式方法相比具有竞争性。
Jun, 2018
该论文提出了一种新型的端对端网络,能够高效地预测实例和物体分割,并引入了一种新的空间排名模块以处理预测实例之间的遮挡问题。在 COCO Panoptic 基准测试上取得了可喜的成果。
Mar, 2019
通过使用开放性全景分割任务,以及采用可变形适配器网络和随机全景等距投影数据增强方法,我们提出的 OOOPS 模型在三个全景数据集上均取得了令人瞩目的性能提升,特别是在野外环境 WildPASS 上达到了 + 2.2%,在室内环境 Stanford2D3D 上达到了 + 2.4%的平均交并比(mIoU)
Jul, 2024
本文提出了一种名为 Video Panoptic Segmentation 的新型视觉识别任务,同时提出了两个视频全景数据集,以及一种 VPSNet 网络,在 VPQ 度量下,在 Cityscapes-VPS 和 VIPER 数据集上实现了最先进的结果。
Jun, 2020
本文提出了一种用于全景分割的深度神经网络,将语义分割与实例分割任务联合起来,从而在单次计算中为输入图像的每个像素提供类标签和唯一对象标识符,并且通过增强信息共享和合并启发式方法,单个网络的性能提高,如在 Cityscapes 上可获得 45.9 的 PQ 分数。
Feb, 2019
本研究提出了一种名为 Fast Panoptic Segmentation Network(FPSNet)的端到端网络,将全景任务转化为自定义的密集像素分类任务以实现像素级分类和实例识别,在 Cityscapes 和 Pascal VOC 数据集上取得了更好或类似的全景分割性能,比现有的全景分割方法更快。
Oct, 2019
本文提出了半监督视频对象分割的概念,给出了 Panoptic Wild Scenes 的大型基准和基线方法,建立了 VIPOSeg 数据集,提出了基于当下流行的 Transformer 的网格架构的强基线方法 PAOT,在 VIPOSeg 和其他 VOS 基准中取得了 SOTA 的性能,并在 VOT2022 挑战活动中获得第一名。
May, 2023
本文提出了一种统一的全景分割网络(UPSNet),通过在单个骨干残差网络上设计基于可变卷积的语义分割头和基于 Mask R-CNN 的实例分割头,同时解决这两个子任务,并引入了一个无需参数的全景头来通过像素级分类解决全景分割,可帮助更好地解决语义分割和实例分割之间的冲突。此外,具有处理不同实例数量挑战的功能,可以端到端地在底部模块中反向传播。实验结果表明,UPSNet 可以实现最先进的性能,并具有更快的推理速度。
Jan, 2019
本文提出了一种称为开放式语义分割(O3S)的统一框架,在视觉示例和文本名称中学习已见和未见的语义。我们的流程通过首先进行单模自我增强和聚合,然后进行多模态补充融合来提取用于分割任务的多模态原型。
Jul, 2023