ICCVSep, 2023

多粒度时间原型学习用于少样本视频目标分割

TL;DR通过引入多粒度的时间引导信息和自适应查询引导线索,利用剪辑和内存原型来分别捕捉本地和长期内部时间引导,从而在处理视频数据的时间相关性时,通过每个帧独立地使用帧原型来处理细粒度的自适应引导并实现双向的剪辑 - 帧原型通信,以减少噪声内存的影响,并提出了一种新的分割损失来增强原型的类别可辨识性。实验结果表明,我们提出的视频 IPMT 模型在两个基准数据集上明显优于先前的模型。