本文介绍了一种基于历史运动数据的视频预测模型,该模型在考虑动态背景的挑战性真实世界自动驾驶数据集上表现优异,相较于现有的随机模型表现显著提升。
Aug, 2021
本文提出了一种新颖的深度学习架构,用于从视频中进行概率未来预测。该模型可以预测城市场景中的未来语义、几何和运动,并将此表示用于控制自动驾驶车辆。
Mar, 2020
通过自适应分解的方法,我们提出了一种状态空间分解的随机视频预测模型,将整体视频帧生成分解为确定性外观预测和随机运动预测,从而增强模型对动态场景的泛化能力。实验结果表明,我们的模型在多个数据集上优于基线模型。
Apr, 2024
本研究针对无监督的视频对象结构和动态提取及预测的挑战,采用基于关键点的图像表示方法,并在关键点的动力学模型上进行学习,以实现像素空间中的稳定学习和错误复合的避免。该方法在像素级视频预测和需要物体级运动动态理解的下游任务方面均优于非结构化表示,并在多个数据集和任务中进行了评估和验证。
Jun, 2019
本文的目的在于提出一种名为 SV2P 的模型,该模型在真实世界的视频数据中获得了可靠的、有多个可行未来的预测结果,相比于传统的视频预测模型,我们的模型明显提升了预测效果。
Oct, 2017
通过对视频场景内容及动态规律、语义等方面的先验知识进行分析和预处理,提出一种利用贝叶斯网络解决视频不同场景中的移动轨迹问题的方法,并在实验中证明了其有效性。
Mar, 2016
介绍了一种基于残差更新规则的新型随机时间模型,可用于视频预测,并在复杂数据集上胜过先前的最先进方法。
Feb, 2020
该论文提出了一种新的方法,通过在一组视频中学习,从单个静态图像中预测运动,该方法利用结构随机森林和回归来学习局部运动模式,并在多种应用程序中添加预测的运动,例如弱帧提议、动作识别和运动显著性。研究表明,运动预测不仅可行,而且对多种应用程序提供有价值的信息。
Mar, 2018
该研究通过进行大规模的实证研究,针对视频帧预测问题,提出了一种不同于以往手工设计架构的方法:尽可能地降低归纳偏差,同时最大化网络容量,该方法表现良好并在三个不同数据集上进行了验证:建模物体交互、建模人类运动和建模汽车驾驶。
Nov, 2019
该研究提出了一种架构和训练方案,通过显式地建模去除和捕捉视频中语义一致的区域的演变来预测视频帧。
Apr, 2021