Dec, 2021
VISOLO:基于网格的时空聚合,实现高效的在线视频实例分割
VISOLO: Grid-Based Space-Time Aggregation for Efficient Online Video Instance Segmentation
Su Ho Han, Sukjun Hwang, Seoung Wug Oh, Yeonchool Park, Hyunwoo Kim...
TL;DR本文提出了一种基于网格结构特征表示的新型单阶段框架,并引入协作操作模块来聚合可用帧的信息以丰富所有 VIS 子任务的特征,从而在所有 VIS 任务中高效地充分利用先前信息,实现了实时处理,并在 YouTube-VIS 2019 和 21 数据集上获得了新的最高准确率(38.6 AP 和 36.9 AP)和速度(40.0 FPS),代码已公开。