May, 2023

单帧布局生成多对象视频

TL;DR该论文研究了视频生成,并着重简化生成条件。作者使用单个帧对象布局作为唯一条件,通过隐式神经表示和布局动态自我推理,提出了一种新的视频生成框架,能够合成全局场景和局部对象,实验结果表明,该模型比基准模型更加有效。