CVPRJun, 2024

GroPrompt:用于参考视频对象分割的高效基于上下文提示和适应性

TL;DR该研究提出了一种基于 Grounded Prompting (GroPrompt) 框架的高效适应基础分割模型来解决仅通过弱监督信息进行 Referring Video Object Segmentation (RVOS) 的问题,并提出了 Text-Aware Prompt Contrastive Learning (TAP-CL) 方法来增强位置提示和指代句子之间的关联。实验证明,该 GroPrompt 框架在标准 RVOS 基准测试中表现出竞争力,仅需边界框的弱监督信息即可。