Jul, 2020

视频深度信息最大化表示学习

TL;DR本文介绍一种名为 Video Deep InfoMax (VDIM) 的自监督学习方法,将原 DeepInfoMax 扩展至视频领域,其利用内部结构构建视图,并利用这些视图进行预测任务,从而实现对 UCF-101 数据集的行为识别任务的 SoTA 预测结果。