MultiXNet: 多类别、多阶段、多模态运动预测
本文提出 Cross-Modal Embedding 框架,以利用多个输入模式的信息来解决自动驾驶系统中的交通代理的未来轨迹预测问题。该方法在训练时学习将一组互补特征嵌入到共享潜在空间中,并利用多个传感器模态进行优化,在测试时可利用单个输入模态生成预测,并取得了很好的效果。
Nov, 2020
本文针对自动驾驶汽车在复杂交通情境下进行安全高效的行驶所需的需求,提出了使用 LSTM 模型来进行交互式的运动预测,并在 NGSIM US-101 和 I-80 数据集上与其他方法进行了比较和分析。
May, 2018
本文介绍了一种使用多视角 LiDAR 点云的双阶段深度神经网络,用于多类目标检测和行驶空间分割,通过两个阶段的处理,能够在挑战性的场景中使用单个 LiDAR 扫描作为输入同时检测和分类物体,同时确定驾驶空间,该系统在配备于自动驾驶汽车的嵌入式 GPU 上能够高效运行,并展示了在 KITTI 数据集和更大型的内部数据集上的测试结果。
Jun, 2020
该论文提出了一种新的基于 transformer 的系统 ——mmTransformer,它使用独立提案集生成和选择提案,并使用基于区域的训练策略诱导所生成提案的多样性。实验表明,该模型在运动预测方面具有最先进的性能,大大提高了预测轨迹的多样性和准确性。
Mar, 2021
自动驾驶系统面临着交通行为不确定性高等问题,本文提出了基于深度卷积神经网络的多轨迹交通演算方法,能够精确地预测交通行为并评估它们的概率,此方法也已成功应用于自动驾驶车辆中。
Sep, 2018
提出了一种名为 MS-Net 的多场景网络,通过进化过程训练一种多路径稀疏模型,实现对不同场景下行人运动的预测,实验结果表明,MS-Net 在行人运动预测数据集(如 ETH 和 UCY)上优于现有的最先进方法,并在 INTERACTION 挑战中排名第二。
Mar, 2024
本文介绍了一种基于 Transformer 结构的神经预测框架来模拟车辆之间的社交关系和预测可能的轨迹,其中采用了多模态注意机制来解决运动预测的多模态问题,并在 Argoverse 运动预测数据集上得到了最佳预测精度。
Sep, 2021
本文提出了一种高效的深度学习模型 MotionNet,通过 LiDAR 扫描的数据实现自动驾驶中的感知和运动预测,该模型基于一种新颖的时空金字塔网络,可以提取深层次的时空特征,并且通过空间和时间一致性约束进一步规范了模型的训练。实验证明,该方法的性能明显优于现有的基于场景流和 3D 目标检测的方法,有望在自动驾驶中提供备用方案和对运动规划员提供补充信息。
Mar, 2020