ECCVApr, 2022

基于无时间感知 VQGAN 和时间敏感 Transformer 的长视频生成

TL;DR本文提出了一种利用 3D-VQGAN 和 transformers 生成长视频的方法,并通过 UCF-101、Sky Time-lapse 和 Taichi-HD 数据集的 16 帧视频剪辑进行了验证,同时还展示了结合文本和音频等条件扩展的方法。