Jun, 2017
一个基于混合深度学习框架的视频分类多模态信息建模模型
Modeling Multimodal Clues in a Hybrid Deep Learning Framework for Video Classification
Yu-Gang Jiang, Zuxuan Wu, Jinhui Tang, Zechao Li, Xiangyang Xue...
TL;DR本文研究如何利用多模态线索来改进视频分类。我们提出了一个混合的深度学习框架,它将静态空间外观信息、短时间内的运动模式、音频信息以及长时序动态性等多个模态的线索集成起来,以捕捉它们之间的关系,并通过多次实验表明,该框架可以提高视频分类的准确度。