Nov, 2016

视频时序建模的双向多速率重建

TL;DR本研究提出一种基于未整理视频的无监督时间建模方法,使用多速率视觉循环模型对视频的每一帧进行编码,通过过去和未来相邻的视频片段作为时间上下文,重构两个时间转换以反映不同视图中的时间信息。将该方法应用于复杂事件检测和视频字幕生成中,其在 MEDTest-13 数据集上相对提高了 10.4%,在 YouTube2Text 数据集中的表现达到了最佳水平。