Oct, 2023

ConditionVideo: 无需训练的条件引导文本到视频生成

TL;DR在本文中,我们介绍了一种无需训练的文本到视频生成方法,通过利用现有的文本到图像生成方法生成逼真的动态视频,这种方法以条件、视频和输入文本为基础。我们的方法将运动表示明确地分为条件引导和场景运动组成,并引入了稀疏双向时空注意力来改善时序一致性。与其他比较方法相比,我们的方法在帧一致性、剪辑评分和条件精度方面表现出卓越性能。