Mar, 2024

视频定制的运动反转

TL;DR本研究提出了一种新颖的方法,用于在视频生成中进行运动定制,解决了视频生成模型中对运动表示的彻底探索的普遍差距。我们介绍了 Motion Embeddings,这是从给定视频中衍生出的一组明确、时间连贯的一维嵌入,旨在与视频扩散模型的时间转换模块无缝集成,通过调节帧间的自注意力计算而不损失空间完整性。我们的方法提供了一种简洁高效的运动表示解决方案,并通过在嵌入空间中进行向量运算,实现了对运动特征的复杂操作定制。此外,我们还发现了视频生成模型中的时间差异,指的是不同运动模块处理帧间时间关系的变化。我们利用这种理解来优化我们的运动嵌入集成。我们的贡献包括为定制任务引入定制运动嵌入、揭示视频模型中的时间处理差异以及通过大量实验证明我们方法的实际优势和有效性。