Sep, 2023
LAVIE:级联潜在扩散模型的高质量视频生成
LAVIE: High-Quality Video Generation with Cascaded Latent Diffusion Models
Yaohui Wang, Xinyuan Chen, Xin Ma, Shangchen Zhou, Ziqi Huang...
TL;DR该研究论文提出了 LaVie,一个整合的视频生成框架,通过利用预训练的文本到图像模型作为基础,以学习高质量的文本到视频生成模型。通过引入简单的时间自注意机制以及联合图像 - 视频微调的过程,LaVie 能够生成视觉逼真且时间连贯的视频,并保留预训练 T2I 模型的创造性。经广泛实验证明,LaVie 在性能上取得了最先进的表现,并可用于不同的长视频生成和个性化视频合成应用。