BriefGPT.xyz
Ask
alpha
关键词
video-level visual-linguistic alignment
搜索结果 - 1
基于语义的物体聚类在视频物体分割任务中的应用
通过语义辅助对象聚类(SOC)的多模态对比监督和强调时间上的连贯性,提出了一种在视频级别视觉语言对齐的增强下,对引用视频对象分割(RVOS)的研究,有效利用间帧关系和理解对象时间变化的文本描述。进行了大量的实验,并在所有基准测试中,我们的方
→
PDF
a year ago
Prev
Next