Jan, 2023

TarViS: 基于目标的视频分割的统一方法

TL;DR该论文提出了TarViS,这是一种新颖的、统一的网络架构,可以应用于任何需要在视频中分割一组任意定义的“目标”的任务,它采用了近期具备多任务能力的方法,并使用抽象的“查询”来预测像素精度的目标掩码,其中一个TarViS模型可以联合训练在不同任务跨越数据集的集合上,并可以在推理过程中在不进行任何任务特定的重新训练的情况下在不同任务之间进行热交换,最终实现了在5/7基准测试中实现了这四个任务的最新性能,并在其余两个上具有竞争力。