Dec, 2021

VISOLO:基于网格的时空聚合,实现高效的在线视频实例分割

TL;DR本文提出了一种基于网格结构特征表示的新型单阶段框架,并引入协作操作模块来聚合可用帧的信息以丰富所有 VIS 子任务的特征,从而在所有 VIS 任务中高效地充分利用先前信息,实现了实时处理,并在 YouTube-VIS 2019 和 21 数据集上获得了新的最高准确率(38.6 AP 和 36.9 AP)和速度(40.0 FPS),代码已公开。