Jan, 2025

通过掩膜:基于掩膜的运动轨迹用于图像到视频生成

TL;DR本研究解决了图像到视频(I2V)生成中静态图像转化为真实视频序列时面临的对象运动不准确和不一致的问题。我们提出了一种两阶段的组合框架,通过引入基于掩膜的运动轨迹作为中间表示,来表达语义对象信息和运动,从而在确保时间一致性和运动真实性方面取得了突破性成果。我们的结果在多对象和高运动场景的基准测试中展示了最优的时序一致性和文本提示的忠实度。