May, 2024

视频扩散模型:训练免费的动作解释器和控制器

TL;DR本研究通过主成分分析 (PC) 分析,揭示了视频扩散模型中稳健的运动感知特征,并通过提出的运动特征 (MOFT) 实现了无需训练的视频运动控制框架,为生成自然逼真的运动提供了竞争性能、架构无关的见解以及在各种下游任务中的适用性。