Dec, 2023

STDiff: 连续随机视频预测的时空扩散

TL;DR提出一种新颖的视频预测模型,该模型具有无限维度潜在变量,通过分解视频运动和内容信息,预测时态运动信息,以及在预测的运动特征和前一帧的条件下自回归生成视频帧。此模型具有更好的表达能力和更强的随机性学习能力,达到了最先进的视频预测性能,并能以任意高帧率进行时间连续预测。