Mar, 2024

通过内容-帧运动-潜变分解实现高效视频扩散模型

TL;DR该研究提出了一种内容-动态潜在扩散模型 (CMD),它是针对视频生成的预训练图像扩散模型的一种高效扩展。CMD通过使用预训练图像扩散模型生成内容帧和训练轻量级扩散模型生成动态潜在表征,实现了更高质量的视频生成和降低的计算成本。