May, 2022

面向复杂和自然视频的简单无监督物体中心学习

TL;DR提出了 STEVE,一种基于无监督学习的视频物体聚焦模型,通过使用基于 Transformer 的图像解码器进行重建观察来实现了对复杂和自然视频的有效性验证,并取得了显著的改进效果。