Dec, 2021

具有自监督的情境化时空对比学习

TL;DR本文提出了一种基于上下文感知的时空对比学习(ConST-CL)的方法,该方法成功地实现了学习细粒度视频表示,利用区域预文本任务引导模型从一个视角到另一个视角转换,并整合整体和局部表示的并行学习过程。我们在多个数据集上评估了所学得的表示,并展示了ConST-CL在6个数据集上取得了具有竞争力的结果,包括Kinetics,UCF,HMDB,AVA-Kinetics,AVA和OTB。