May, 2023

保留自身关联性:一种视频扩散模型的噪声先验

TL;DR本文提出了一种新的视频综合方法,它使用预训练模型,并使用经过精心设计的视频噪声先验来生成高质量,时域一致的序列帧,获得了在 UCF-101 和 MSR-VTT 基准测试上 SOTA 的无需训练文本到视频结果。同时,在较小的 UCF-101 基准测试中使用更少的计算资源, $10 imes$更小的模型,达到了SOTA的视频生成质量。