May, 2023

基于语义的物体聚类在视频物体分割任务中的应用

TL;DR通过语义辅助对象聚类(SOC)的多模态对比监督和强调时间上的连贯性,提出了一种在视频级别视觉语言对齐的增强下,对引用视频对象分割(RVOS)的研究,有效利用间帧关系和理解对象时间变化的文本描述。进行了大量的实验,并在所有基准测试中,我们的方法都以显著的优势优于现有的最先进竞争对手。