ICCVAug, 2023

语义与时间关联:视频中自监督目标中心学习

TL;DR自我监督方法在学习高层语义和低层时间对应方面取得了显著进展,本文在此基础上进一步探索了整合这两个特征以增强以对象为中心的表示的可能性。我们提出了一种新颖的语义感知遮蔽插槽注意力模型,通过融合语义特征和对应关系图,有效地识别多个对象实例,达到了在无监督视频对象发现和密集标签传播任务上的有希望结果,展示了以对象为中心的分析的潜力。