利用字幕的关注语义视频生成

Aug, 2017

Attentive Semantic Video Generation using Captions

Tanya Marwah, Gaurav Mittal, Vineeth N. Balasubramanian

TL;DR该研究提出了一种网络架构，利用标题执行可变长度的语义视频生成。网络能够区分视频中的对象，动作和交互，并将它们与长期和短期依赖结合起来，以增量方式生成视频。网络通过学习潜在表示对视频进行无监督生成，并在执行其他任务时表现出了良好的能力，如动作识别和空时样式转移。

Abstract

This paper proposes a network architecture to perform variable length semantic video generation using captions. We adopt a new perspective