Jan, 2024
基于布朗桥的开放词汇视频实例分割
Instance Brownian Bridge as Texts for Open-vocabulary Video Instance Segmentation
Zesen Cheng, Kehan Li, Hao Li, Peng Jin, Chang Liu...
TL;DR我们提出了一种名为 BriVIS 的方法,通过建立帧级实例表示与类别文本之间的布朗桥对准,实现了更精确的开放词汇 VIS,超越了 OV2Seg,并在挑战性数据集 BURST 上取得了 7.43 的 mAP,相比 OV2Seg 提高了 49.49%。