Jun, 2024

UVIS: 无监督视频实例分割

TL;DRUVIS是一种无监督视频实例分割框架,利用DINO模型的密集形状先验和CLIP模型的开放识别能力,通过帧级伪标签生成、基于Transformer的VIS模型训练和基于查询的跟踪等三个关键步骤实现,通过采用双存储器设计,包括语义存储器和跟踪存储器,以提高无监督环境下VIS预测的质量,在YoutubeVIS-2019等相应基准上取得了21.1 AP的结果,展示了该无监督VIS框架的潜力。