Jul, 2021

CCVS: 上下文感知可控视频合成

TL;DR本文提出了一种自监督学习方法,用于从旧视频剪辑中合成新视频剪辑,并介绍了多个新的关键元素,以改善其空间分辨率和逼真程度。通过对时间连续性的上下文信息和对精细控制的辅助信息进行综合利用,该方法的预测模型在自编码器的潜在空间和图像空间中进行双自回归,以提高其输出的逼真程度,并通过可学习的光流模块来实现时空一致性。同时,插入于编码器和潜在空间预测模块之间的量化器和插入于预测模块和解码器之间的其逆操作提供了额外的灵活性。实验结果表明,该方法在多个任务和标准基准测试上的定性和定量结果都非常好。