CVPRDec, 2019

从未经筛选的教育视频中的视觉表示端到端学习

TL;DR本文介绍了一种新的学习方法,MIL-NCE, 用于从讲述视频中学习强大的视频表示,并能够在不需要手动注释的情况下进行。该方法通过对齐不对称的讲述视频,有效地学习了视频表示。作者在 HMDB-51、UCF-101、Kinetics-700 等多个数据集上进行了评估,证明了该方法优于已发表的自监督方法和多个全监督基准线的表现。