Jun, 2024

无需训练的鲁棒交互式视频目标分割

TL;DR我们提出了一种无需训练的提示跟踪框架,将稀疏点和框跟踪相结合,采用交叉循环时空模块从多次交互中自适应地聚合引用信息,实现了在流行的 VOS 数据集上稳定的零样本视频分割结果,保持了性能和交互时间之间的良好权衡。