ICCVJan, 2019

DistInit: 不使用单个带标签视频学习视频表示

TL;DR本文提出了一种另类的方法,通过使用预训练的图像模型作为 “老师” 来训练视频模型,从而实现对视频表示的无监督学习。相比于现有的技术,该方法在 input modalities 的不同数据源下具有更强的迁移性能,并在彻底未被筛选的原始视频数据来源下进行训练。