ECCVApr, 2019

大规模整体视频理解

TL;DR本文介绍了一个基于语义分类的大规模 Holistic 视频理解数据集 HVU,它实现了对多标签、多任务视频理解的全面考虑,以及介绍了一种新的综合外观和时间神经网络体系结构 HATNet,本文拓展了视频识别范畴,验证了 Holistic 表示学习在许多实际应用程序中的重要作用。