Jan, 2018

一种用于360度视频时空精彩片段检测的深度排名模型

TL;DR本文提出了一种基于空间和时间摘要的方法来从长视频中检测高光部分。通过从无限视角中选择宜人的普通视野(NFOV)段落并将其在时间上进行总结,选择子镜头的子集来形成简明的和信息丰富的高光。研究人员提出了一种名为组合视图分数(CVS)模型的新型深度排名模型,该模型为每个视频段的组合生成一个球面分数图,并在推理时通过滑动窗口内核确定哪个视图适用于高光。通过在Pano2Vid基准数据集和从YouTube和Vimeo收集的我们新收集的360度视频亮点数据集上评估所提出的框架,我们进行了实验。通过使用定量总结度量和通过Amazon Mechanical Turk的用户研究进行评估,我们证明了我们的方法优于几种现有的高光检测方法。同时,我们还展示了我们的模型在推理速度上比AutoCam(360视频摘要的第一个算法之一)快16倍。