ParkPredict+: 基于 CNN 和 Transformer 的停车场车辆多模态意图和运动预测

Apr, 2022

ParkPredict+: 基于 CNN 和 Transformer 的停车场车辆多模态意图和运动预测

ParkPredict+: Multimodal Intent and Motion Prediction for Vehicles in Parking Lots with CNN and Transformer

Xu Shen, Matthew Lacayo, Nidhir Guggilla, Francesco Borrelli

TL;DR该研究使用卷积神经网络和 Transformer 网络从轨迹历史记录和卫星图像中提取时间空间和语境信息，对停车场中人驱动车辆的多模态意图和轨迹预测问题进行了研究，并提出了一种新的方法，能够更精确地预测多个模态，并编码复杂的多智能体场景，同时能够适应不同的停车地图。为了训练和评估方法，该研究还介绍了一组公开的 4K 视频数据集，其中包括了准确的注释、高帧率和丰富的交通场景。

Abstract

The problem of multimodal intent and trajectory prediction for human-driven vehicles in parking lots is addressed in this paper. Using mod

multimodal intent trajectory prediction cnn transformer networks parking lots

发现论文，激发创造

利用 Transformer 模型融合多源交通需求数据进行城市停车预测

基于时空深度学习和多源数据融合的停车可用性预测框架提供了更准确和及时的信息，促进了更高效和可持续的城市出行。

May, 2024

基于 Transformer 的多模式神经网络用于自动驾驶的运动预测

本文介绍了一种基于 Transformer 结构的神经预测框架来模拟车辆之间的社交关系和预测可能的轨迹，其中采用了多模态注意机制来解决运动预测的多模态问题，并在 Argoverse 运动预测数据集上得到了最佳预测精度。

Sep, 2021

车辆语义意图和运动的概率预测

本文提出了一种基于深度神经网络的语义意图和运动预测（SIMP）方法，该方法使用语义定义的车辆行为来适应任何驾驶场景，结合分类意向和运动信息准确地预测自动驾驶车辆的行驶路径。

Apr, 2018

基于循环神经网络的自然驾驶员意图和路径预测

使用循环神经网络和混合密度网络在城市路口进行多模态路径预测和聚类，验证了方法的性能和广泛适用性。

Jul, 2018

多模态变压器下的上下文感知行人轨迹预测

我们提出了一种新颖的解决方案，用于预测行人的未来轨迹。我们的方法使用多模态编码 - 解码变换器架构，以行人位置和自车速度作为输入。值得注意的是，我们的解码器一次性预测整个未来轨迹，而不进行一步预测，这使得该方法适用于嵌入式边缘部署。我们在两个流行数据集 PIE 和 JAAD 上进行了详细实验和评估，定量结果证明我们所提出的模型在 0.5、1.0 和 1.5 秒三个时间范围内始终具有最低误差，并且相对于现有最先进技术的速度更快。此外，消融实验证明了我们方法的关键多模态配置的影响。

Jul, 2023

基于堆叠 Transformer 的多模态动作预测

该论文提出了一种新的基于 transformer 的系统 ——mmTransformer，它使用独立提案集生成和选择提案，并使用基于区域的训练策略诱导所生成提案的多样性。实验表明，该模型在运动预测方面具有最先进的性能，大大提高了预测轨迹的多样性和准确性。

Mar, 2021

停车场占用检测中深度学习方法的修订

该研究通过比较和评估现有车位检测算法和视觉转换器，提出了一种新的基于 EfficientNet 体系结构的管道，以增加现有系统的泛化能力和适应特定的视觉条件，从而提高停车场占用检测的效果。

Jun, 2023

自动驾驶车辆的多模态轨迹预测：基于语义地图与动态图注意力网络

本文研究自动驾驶汽车预测未来路障轨迹的问题，提出了一种基于动态图注意力网络的方法，针对交通规则、社交互动、多类交通运动等方面的挑战，能够使用单一模型对多模态轨迹进行概率预测，并经过多个数据集的验证，证明该方法具有实际应用潜力且优于现有技术。

Mar, 2021

基于视觉模型的行人动作预测分析

本文研究如何利用图像信息来预测行人的行为，提出了几种基于 CNN 和 Transformer 的时空模型，分析了这些模型的预测结果的可解释性，强调在行人行为预测问题中可解释性的重要性。

May, 2023

基于时空 DenseNet 的自主地面车辆的行人实时意图预测

本文提出了一种基于图像序列的单目 RGB 相机的实时框架，使用区别于基线方法的跟踪 - 检测技术和创新的时空 DenseNet 模型识别、跟踪和预测行人在城市交通环境中的意图和动作，以实现对自主地面车辆行为的理解。实验表明，该方法在实时性和效果方面比其他基线方法更具鲁棒性和竞争力，平均精度得分为 84.76％，帧率为 20FPS。

Apr, 2019