Feb, 2023

结构和内容引导的扩散模型视频合成

TL;DR本研究提出一种结构与内容导向的视频扩散模型。训练过程基于单眼深度估计,能够控制结构和内容的保真度,并通过新的指导方法使模型展现明确的时间一致性控制。实验结果表明该模型可以实现对视频特征的精细控制,依据少数参考图像定制化编辑,且用户更倾向于使用该模型的结果。