Jan, 2016

使用多阶段CNN在未修剪的视频中进行时间动作定位

TL;DR本研究提出了一种基于三种分段3D卷积神经网络的方法,用于解决未经修剪的长视频中的时间动作定位问题,其中提出网络用于识别可能包含动作的候选段,分类网络以一对多动作分类模型进行学习以作为定位网络的初始化,用于定位每个动作实例。