ICCVSep, 2023

重新思考从学习有监督信号与以对象为中心的表示进行的非物质视频分割

TL;DR视频模态分割是计算机视觉中一个具有挑战性的任务,本文提出了一种基于对象中心表示的高效模态分割方法,利用运动流和多视图信息相互融合,引入三维信息以提升特征质量,并通过对象插槽和注意机制完成充分的对象表示,实现对物体的全遮罩分割。