随机变分视频预测

Oct, 2017

Stochastic Variational Video Prediction

Mohammad Babaeizadeh, Chelsea Finn, Dumitru Erhan, Roy H. Campbell, Sergey Levine

TL;DR本文的目的在于提出一种名为 SV2P 的模型，该模型在真实世界的视频数据中获得了可靠的、有多个可行未来的预测结果，相比于传统的视频预测模型，我们的模型明显提升了预测效果。

Abstract

Predicting the future in real-world settings, particularly from raw sensory observations such as images, is exceptionally challenging. real-world events can be →

real-world stochastic prediction video multi-frame

发现论文，激发创造

随机对抗视频预测

本文探讨了两种机器学习模型用于生成视频未来帧预测的方法，并将它们相结合得到更真实、多样性更好的预测结果。

Apr, 2018

随机潜在残差视频预测

介绍了一种基于残差更新规则的新型随机时间模型，可用于视频预测，并在复杂数据集上胜过先前的最先进方法。

Feb, 2020

使用学习的先验知识生成随机视频

本文提出一种无监督视频生成模型，该模型学习给定环境中的不确定性先验模型，通过从先验分布中取样并与未来帧的确定性估计相结合来生成视频帧。该方法方便易行，能够在各种数据集上进行端到端训练，并且即使在很多帧进入未来的情况下，样本生成的结果也经过了充分的测试且清晰度较高，比现有的方法更具优势。

Feb, 2018

VideoFlow: 用于随机视频生成的条件流模型

我们提出了一种基于归一化流的多帧视频预测方法，可以直接优化数据可能性并生成高质量的随机预测，该方法可以实现对于视频生成建模的可行且竞争性的方法。

Mar, 2019

结构与运动的随机视频预测

本文提出了将视频观察结果分解为静态和动态部分，分别建模于场景结构和车辆主体运动、动态物体运动，来分离结构和运动的影响，从而更好地预测复杂驾驶场景中的未来运动。

Mar, 2022

视频场景理解的概率未来预测

本文提出了一种新颖的深度学习架构，用于从视频中进行概率未来预测。该模型可以预测城市场景中的未来语义、几何和运动，并将此表示用于控制自动驾驶车辆。

Mar, 2020

基于层级变分神经不确定模型的随机视频预测

提出一种基于神经不确定性量化器（NUQ）的层次化变分框架，并利用深度贝叶斯图模型，从而准确地预测视频的未来帧，同时可以权衡 MSE 丢失，从而比现有的模型更有效地训练，提高生成视频的质量和多样性。

Oct, 2021

在条件随机网络下进行多模式运动预测

本文提出一种基于随机神经网络架构来处理多样性数据分布的方法，并通过实验验证应用于处理物体轨迹、人体关节轨迹和视频预测等问题中，取得了较好的实验效果。

May, 2017

STDiff: 连续随机视频预测的时空扩散

提出一种新颖的视频预测模型，该模型具有无限维度潜在变量，通过分解视频运动和内容信息，预测时态运动信息，以及在预测的运动特征和前一帧的条件下自回归生成视频帧。此模型具有更好的表达能力和更强的随机性学习能力，达到了最先进的视频预测性能，并能以任意高帧率进行时间连续预测。

Dec, 2023

考虑长期运动趋势的视频预测的状态空间分解模型

通过自适应分解的方法，我们提出了一种状态空间分解的随机视频预测模型，将整体视频帧生成分解为确定性外观预测和随机运动预测，从而增强模型对动态场景的泛化能力。实验结果表明，我们的模型在多个数据集上优于基线模型。

Apr, 2024