使用可变形卷积进行单层特征到特征预测

Jul, 2019

使用可变形卷积进行单层特征到特征预测

Single Level Feature-to-Feature Forecasting with Deformable Convolutions

Josip Šarić, Marin Oršić, Tonći Antunović, Sacha Vražić, Siniša Šegvić

TL;DR本文提出基于特征预测的方法，用于自动驾驶等决策系统中对未来帧像素的预测，进而提高模型的性能表现，实现在 Cityscapes 测试数据集上的 state of the art 表现。

Abstract

Future anticipation is of vital importance in autonomous driving and other decision-making systems. We present a method to anticipate semantic segmentation of future frames in driving scenarios based on feature-to-feature →

autonomous driving semantic segmentation forecasting deformable convolutions cityscapes validation set

发现论文，激发创造

通过预测卷积特征预测未来实例分割

研究了使用 Mask R-CNN 模型在语义级别预测未来视频实例分割的方法，相对于使用光流和实例分割方法，该方法表现更好。

Mar, 2018

循环流引导的语义预测

本研究为了实现自主系统对未来的实时预测，将挑战性的语义预测任务分解为两个子任务：当前帧的分割和未来光流的预测，并通过引入流预测网络和特征 - 流聚合 LSTM 层以及可端到端学习的扭曲层来构建高效、有效、低开销的模型，最终实现在短期和移动对象语义预测方面的最新精度，并将模型参数降低了高达 95%，效率提高了 40 倍以上。

Sep, 2018

深入预测语义分割的未来

本文介绍了一种新的任务，即预测未来帧的语义分割，并研发了一种基于自回归卷积神经网络的方法。该方法针对城市街景数据集进行了试验，结果表明，直接预测未来的分割比预测并分割未来的 RGB 帧要好得多，并且可信度更高。

Mar, 2017

基于卷积 LSTM 的未来语义分割

本文提出了一种新的模型，使用 ConvLSTM 编码观察到的视频帧的时空信息来预测未观察到的未来帧的语义分割图，并扩展了双向 ConvLSTM 来捕获双向的时间信息，该方法在基准数据集上优于其他最先进的方法，为实时决策制定提供了可靠的解决方案。

Jul, 2018

未来分割

提出了一种基于编码器 - 解码器网络的视频未来语义分割预测方法，使用先前的视频帧，仅利用 RGB 数据，利用知识蒸馏的训练框架预测未来场景的语义分割，并在 Cityscapes 和 Apolloscape 上取得了比基线和现有最先进方法更好的结果。

Apr, 2019

卷积编解码神经网络实现一步时变视频未来帧预测

本文讨论了使用卷积神经网络预测自主汽车，无人机和其他机器人的未来出现，实现了可以在任意时间预测未来外观的功能。

Feb, 2017

视频场景理解的概率未来预测

本文提出了一种新颖的深度学习架构，用于从视频中进行概率未来预测。该模型可以预测城市场景中的未来语义、几何和运动，并将此表示用于控制自动驾驶车辆。

Mar, 2020

路规：使用语义交互的卷积模型预测驾驶行为

这篇论文提出了一种基于深度卷积模型的统一表征方法，该方法在使用 3D 感知信号和语义地图的基础上，通过深度卷积模型，学习了实体和场景之间的交互，并能够有效地预测自动驾驶系统中实体的行为表现。

Jun, 2019

基于几何和时间条件的长期期货预测

该研究旨在通过预测编码的概念以及诸如自动驾驶车辆之类的机器人应用，探索基于过去条件下生成未来传感器观测的任务。研究重点在于解决多模态未来视频建模的挑战，并利用图像扩散模型的大规模预训练来处理计算代价昂贵的视频处理问题。通过时间戳条件生成更好的采样计划，实验结果证明了学习以时间戳为条件和预测使用不变模态的重要性。

Apr, 2024

基于视觉引导的预测 —— 多时序预测的视觉上下文

本研究针对自动驾驶中的多视角预测车辆状态的问题，提出了一种多视角与历史轨迹相融合的预测框架，并通过使用 3D 卷积从视频中提取视觉特征以及通过 1D 卷积从车速和转向角度轨迹数据中提取特征，实现了在实际数据集上的车辆状态预测任务中的优越表现。

Jul, 2021