本文探讨了两种机器学习模型用于生成视频未来帧预测的方法,并将它们相结合得到更真实、多样性更好的预测结果。
Apr, 2018
介绍了一种基于残差更新规则的新型随机时间模型,可用于视频预测,并在复杂数据集上胜过先前的最先进方法。
Feb, 2020
本文提出一种无监督视频生成模型,该模型学习给定环境中的不确定性先验模型,通过从先验分布中取样并与未来帧的确定性估计相结合来生成视频帧。该方法方便易行,能够在各种数据集上进行端到端训练,并且即使在很多帧进入未来的情况下,样本生成的结果也经过了充分的测试且清晰度较高,比现有的方法更具优势。
Feb, 2018
我们提出了一种基于归一化流的多帧视频预测方法,可以直接优化数据可能性并生成高质量的随机预测,该方法可以实现对于视频生成建模的可行且竞争性的方法。
Mar, 2019
本文提出了将视频观察结果分解为静态和动态部分,分别建模于场景结构和车辆主体运动、动态物体运动,来分离结构和运动的影响,从而更好地预测复杂驾驶场景中的未来运动。
Mar, 2022
本文提出了一种新颖的深度学习架构,用于从视频中进行概率未来预测。该模型可以预测城市场景中的未来语义、几何和运动,并将此表示用于控制自动驾驶车辆。
Mar, 2020
提出一种基于神经不确定性量化器(NUQ)的层次化变分框架,并利用深度贝叶斯图模型,从而准确地预测视频的未来帧,同时可以权衡 MSE 丢失,从而比现有的模型更有效地训练,提高生成视频的质量和多样性。
Oct, 2021
本文提出一种基于随机神经网络架构来处理多样性数据分布的方法,并通过实验验证应用于处理物体轨迹、人体关节轨迹和视频预测等问题中,取得了较好的实验效果。
May, 2017
提出一种新颖的视频预测模型,该模型具有无限维度潜在变量,通过分解视频运动和内容信息,预测时态运动信息,以及在预测的运动特征和前一帧的条件下自回归生成视频帧。此模型具有更好的表达能力和更强的随机性学习能力,达到了最先进的视频预测性能,并能以任意高帧率进行时间连续预测。
Dec, 2023
通过自适应分解的方法,我们提出了一种状态空间分解的随机视频预测模型,将整体视频帧生成分解为确定性外观预测和随机运动预测,从而增强模型对动态场景的泛化能力。实验结果表明,我们的模型在多个数据集上优于基线模型。
Apr, 2024