Apr, 2024

LoopAnimate:可循环的显著对象动画

TL;DR该论文提出了一种名为 LoopAnimate 的新方法,用于生成具有一致的起始和结束帧的视频,通过解耦多级图像外观和文本语义信息,将图像外观和文本语义嵌入到扩散模型的不同位置,以提高对象准确性,并引入 Temporal Enhanced Motion Module(TEMM)来扩展编码时间和位置信息的能力,使得该方法能够生成长度为 35 帧且质量较高的视频,实验证明其在客观指标(如准确性和时间一致性)和主观评估结果上均达到了最先进的性能。