Apr, 2024

MagicTime: 作为形变模拟器的延时摄影视频生成模型

TL;DR提出了 MagicTime,这是一个从时间间隔视频学习真实世界物理知识并实现变形生成的模型。设计了 MagicAdapter 方案来解耦空间和时间训练,引入了 Dynamic Frames Extraction 策略来适应变形时间间隔视频,并引入了 Magic Text-Encoder 来改善对变形视频提示的理解。通过实验证明了 MagicTime 在生成高质量和动态变形视频方面的优越性和有效性,表明时间间隔视频生成是构建物理世界变形模拟器的有希望的路径。