Jun, 2023

学习我们可以的力量:从像素级交互生成多对象视频

TL;DR我们提出了一种新颖的无监督方法,可以根据单个帧和稀疏动作输入自回归地生成视频,该方法能够生成逼真的物体间相互作用,并能在只观察到它们在相关动作活动下运动时分离多个物体的动力学和幅度;我们的模型 YODA 能够移动物体而不用直接接触它们,定性和定量实验表明,YODA 在几个数据集上的视频生成效果不仅与现有领先工作相当,而且表现更优秀。