Dec, 2021

Slot-VPS:视频全景分割的面向对象表示学习

TL;DR该论文提出了 Slot-VPS 框架,使用对象中心学习的方法,将所有视频中的 panoptic 实体编码成 panoptic slots,通过 Video Panoptic Retriever 来检索和编码统一的空间 - 时间信息,实现了对视频中对象的定位、分割、区分和关联,从而实现了 Video Panoptic Segmentation 任务的端到端处理。该方法在 Cityscapes-VPS 和 VIPER 数据集上均取得了 63.7,63.3,56.2 VPQ 的最优性能。