Apr, 2020

可查询的视频摘要

TL;DR本文提出一种基于监督学习的、端到端深度学习的方法,用于生成与文本查询相关联的视频摘要。该方法提出了包括视频摘要控制器、视频摘要生成器和视频摘要输出模块在内的一整套系统,并介绍了一个包含帧级别相关性评分标签的数据集。实验结果表明,文本查询可以控制视频摘要,且可提高模型的性能。