CVPRApr, 2017

基于结构最大化和时间的行为定位

TL;DR本研究解决视频中时间段行动定位的问题,使用结构化预测来对任意长度的时间窗口进行评分,同时将每个行动的开始、中间和结束作为单独的组件进行分类,从而明确地建模每个行动的时间演变并利用该结构中存在的有价值的时间依赖关系,最后通过使用深度卷积神经网络来计算帧分类分数,并针对新颖的结构化目标进行端到端的训练以直接优化分类结果。在 THUMOS14 行动检测基准测试中,本系统表现出竞争力。