Nov, 2020

通过对比集合学习面向对象的视频模型

TL;DR通过引入全局、基于集合的对比损失和基于注意力的编码器,将个体目标表示相互对比更改为聚合表示并相互对比,从而在自监督学习中更有效地推动物体中心表示的出现,并在两个合成视频数据集上得到更好的效果。