使用可变形卷积进行单层特征到特征预测
本研究为了实现自主系统对未来的实时预测,将挑战性的语义预测任务分解为两个子任务:当前帧的分割和未来光流的预测,并通过引入流预测网络和特征 - 流聚合 LSTM 层以及可端到端学习的扭曲层来构建高效、有效、低开销的模型,最终实现在短期和移动对象语义预测方面的最新精度,并将模型参数降低了高达 95%,效率提高了 40 倍以上。
Sep, 2018
本文介绍了一种新的任务,即预测未来帧的语义分割,并研发了一种基于自回归卷积神经网络的方法。该方法针对城市街景数据集进行了试验,结果表明,直接预测未来的分割比预测并分割未来的 RGB 帧要好得多,并且可信度更高。
Mar, 2017
本文提出了一种新的模型,使用 ConvLSTM 编码观察到的视频帧的时空信息来预测未观察到的未来帧的语义分割图,并扩展了双向 ConvLSTM 来捕获双向的时间信息,该方法在基准数据集上优于其他最先进的方法,为实时决策制定提供了可靠的解决方案。
Jul, 2018
提出了一种基于编码器 - 解码器网络的视频未来语义分割预测方法,使用先前的视频帧,仅利用 RGB 数据,利用知识蒸馏的训练框架预测未来场景的语义分割,并在 Cityscapes 和 Apolloscape 上取得了比基线和现有最先进方法更好的结果。
Apr, 2019
这篇论文提出了一种基于深度卷积模型的统一表征方法,该方法在使用 3D 感知信号和语义地图的基础上,通过深度卷积模型,学习了实体和场景之间的交互,并能够有效地预测自动驾驶系统中实体的行为表现。
Jun, 2019
该研究旨在通过预测编码的概念以及诸如自动驾驶车辆之类的机器人应用,探索基于过去条件下生成未来传感器观测的任务。研究重点在于解决多模态未来视频建模的挑战,并利用图像扩散模型的大规模预训练来处理计算代价昂贵的视频处理问题。通过时间戳条件生成更好的采样计划,实验结果证明了学习以时间戳为条件和预测使用不变模态的重要性。
Apr, 2024
本研究针对自动驾驶中的多视角预测车辆状态的问题,提出了一种多视角与历史轨迹相融合的预测框架,并通过使用 3D 卷积从视频中提取视觉特征以及通过 1D 卷积从车速和转向角度轨迹数据中提取特征,实现了在实际数据集上的车辆状态预测任务中的优越表现。
Jul, 2021