Dec, 2023

文本到视频生成的层次化时空解耦

TL;DR提出了 HiGen,一种基于扩散模型的方法,通过从结构层面和内容层面解耦视频的空间和时间因素,实现了在生成视频时具备语义准确性和运动稳定性的方法。