May, 2018

基于记忆网络的基于故事的360°视频时间摘要方法

TL;DR我们提出一种名为过去-未来记忆网络模型(PFMN)的方法来解决360度视频的基于故事的时间摘要问题。我们通过计算来自输入视频的81个普通视场(NFOV)区域建议的分数,并利用两个外部记忆存储先前选择的子镜头和未来候选子镜头的嵌入,从而恢复潜在的汇总。我们的实验结果表明,我们的模型在Pano2Vid,360度视频和基于图像的VIST数据集上均取得了最先进的表现。