- ICCV学习表示以预测未来活动
本文提出了一种基于网络模块的自监督学习方法,旨在预测未来活动,并通过多假设方案及描述生成器阐述其意义,也在广泛的数据集上进行了活动分类实验。
- 改进的条件性 VRNNs 用于视频预测
本文提出了一种基于层次结构的潜变量模型来提高模型表达能力,减少模糊预测,用于视频序列的未来帧预测任务,经过实验证明本方法在不同数据集上优于现有的潜变量模型。
- 未来分割
提出了一种基于编码器 - 解码器网络的视频未来语义分割预测方法,使用先前的视频帧,仅利用 RGB 数据,利用知识蒸馏的训练框架预测未来场景的语义分割,并在 Cityscapes 和 Apolloscape 上取得了比基线和现有最先进方法更好 - FutureGAN: 使用渐进式增长的 GAN 模型和时空 3D 卷积预测视频序列的未来帧
本文介绍了一种新的编码器 - 解码器对抗生成网络模型 FutureGAN,它可以在过去一段时间的视频帧的基础上预测未来的帧,采用了视空间 3D 卷积,扩展了渐进式 GAN 的概念,并且在 MovingMNIST,KTH Action 和 C - 循环流引导的语义预测
本研究为了实现自主系统对未来的实时预测,将挑战性的语义预测任务分解为两个子任务:当前帧的分割和未来光流的预测,并通过引入流预测网络和特征 - 流聚合 LSTM 层以及可端到端学习的扭曲层来构建高效、有效、低开销的模型,最终实现在短期和移动对 - 人类动作识别与预测:调查
该论文综述了计算机视觉和机器学习在视频分析任务中的应用,重点介绍了动作识别和预测两个领域的现有技术、算法、数据集、评价标准及未来发展方向。
- ICML广义 Earley 解析器:连接符号语法和序列数据以进行未来预测
本研究旨在解决对未来序列数据的预测问题,提出将 Earley 解析器推广至未分段无标签序列数据,利用语言模型对最优的分段与标签进行预测,取得了显著的人类活动预测性能优于传统方法。
- 随机对抗视频预测
本文探讨了两种机器学习模型用于生成视频未来帧预测的方法,并将它们相结合得到更真实、多样性更好的预测结果。
- 深度学习神经网络表征非线性动力系统的 Koopman 算符
这篇文章提出了一种基于深度学习的方法来学习非线性动力学系统的 Koopman 算子,自动选择高效的深度字典来描述这些系统,并成功预测了未来 100 步的量化预测和 400 步的定性振荡行为。
- 卷积编解码神经网络实现一步时变视频未来帧预测
本文讨论了使用卷积神经网络预测自主汽车,无人机和其他机器人的未来出现,实现了可以在任意时间预测未来外观的功能。
- 博客圈子演化预测的不同方法
本文介绍了一种新的小组识别和未来事件预测方法,并与现有方法进行了比较。所进行的实验证明了预测结果的高质量,并表明使用多种指标来描述群体轮廓可以提高预测的效果。