Nov, 2021

分层可控视频生成

TL;DR本文提出了一种分层可控的视频生成方法,其中用户可以通过简单操作前景掩码来控制视频生成过程,以此实现对视频生成的更加精细的控制。该方法采用两阶段学习,第一阶段通过前景尺寸先验和 VQ-VAE 生成器学习如何将帧分离为前景和背景层,并在这些层的条件下生成下一帧;第二阶段通过拟合参数化控制,微调网络以预测后续帧中的MASK情况。实验表明,该方法拥有更好的控制效果,同时在两个基准数据集上实现了最先进的性能。