Oct, 2023

从一段长的无标签视频中学习强大的图像编码器,ImageNet 是否值得?

TL;DR通过研究第一人称视频和引入 “漫步旅行” 数据集,本文介绍了一种新颖的适用于连续视频学习的自监督图像预训练方法,称为 DoRA 方法,通过跟踪和学习来发现和追踪对象,使得单个 “漫步旅行” 视频在多个图像和视频下游任务中成为 ImageNet 的强有力竞争者。