VisionTraj:基于大规模摄像机网络的抗噪轨迹恢复框架
本论文提出了一种基于模仿学习的不确定性感知的端到端轨迹生成方法,能够从前置相机图像中提取空时特征,并能在不同环境中生成可靠的轨迹,具有优于现有最先进的端到端控制方法的跨场景 / 平台驾驶结果。
Apr, 2020
通过利用视觉定位技术,我们提出了一种新的方法来预测失去视线的轨迹,该方法能够在无监督的情况下去噪传感器观测,并将基于传感器的轨迹精确映射到视觉轨迹。该方法在失去视线的噪声传感器轨迹去噪和预测方面展示了最先进的性能,在 Vi-Fi 和 JRDB 数据集上取得了重要的成果。通过提高轨迹预测的准确性并解决失去视线物体的挑战,我们的工作显著有助于提高复杂环境下自动驾驶的安全性和可靠性。我们的工作代表着失去视线轨迹预测(OOSTraj)的第一个尝试,并为未来的研究设定了新的基准。代码可在 https://github.com/Hai-chao-Zhang/OOSTraj 找到。
Apr, 2024
本文提出了一种基于变压器的道路网络增强轨迹恢复框架 (RNTrajRec),其中使用 GridGNN 学习每个道路段的嵌入特征,GPSFormer 学习丰富的空间和时间特征以及一个子图生成模块来捕获轨迹中每个 GPS 点的空间特征,在三个大规模真实轨迹数据集上的实验证实了我们方法的有效性。
Nov, 2022
本文提出了一种新的城市交通量推断框架,使用探测器和摄像头捕获到的密集 GPS 轨迹以及不完整轨迹,结合高保真交通模拟器和深度强化学习方法从不完整轨迹中恢复完整车辆行驶轨迹,并通过构建时空图和多视图图嵌入模型,推断未监测到的道路交通量。实验结果表明,该方法在中国省会城市的两个大区域中表现出了较高的准确性。
Feb, 2019
本文提出了一种新颖的端到端架构,该架构接受原始视频输入并输出未来车辆运动轨迹预测,以解决自主驾驶中的邻近车辆运动预测问题。该架构通过多头注意力回归网络和非线性优化提取和跟踪附近车辆的三维位置,然后使用基于注意力的 LSTM 编码器 - 解码器算法对车辆之间的相互依赖关系建模,从而达到了高精度的未来车辆轨迹预测,实验结果表明,该算法优于目前各种先进模型。
Apr, 2023
通过使用拓扑约束扩散模型的可控轨迹生成框架 ControlTraj,该研究提出了一种生成高度保真轨迹的方法,并整合了道路网络拓扑的结构约束,以指导地理结果。
Apr, 2024
本研究旨在为复杂轨迹提供更强大的轨迹恢复。通过定义基于绕道分数和熵分数的轨迹复杂度,并相应构建复杂感知语义图,我们提出了一种多视图图和复杂感知变压器(MGCAT)模型,以从两个方面在轨迹预训练中编码这些语义信息:1) 考虑轨迹模式自适应地聚合多视图图特征,并且 2) 在复杂轨迹中对关键节点进行更高的关注。我们的 MGCAT 在处理复杂轨迹的关键场景时具有感知性能,通过在大规模数据集上进行的广泛实验证明,我们的方法提供了更好的轨迹恢复表示,整体 F1 得分提高了 5.22%,对于复杂轨迹特别是 F1 得分提高了 8.16%。
Nov, 2023
我们提出了一种轻量级的等变规划模型,它在生成所有车辆的多模态联合预测并选择一个模态作为自主计划时,结合了运动预测和轨迹规划。通过嵌入车辆位置并在潜在空间中沿着高级路线指导自主车辆,我们的方法提供了具有目标导向行为的等变规划,同时在保持等变性的同时不强制汽车始终沿着确切的路线行驶。我们在具有挑战性的 nuScenes 数据集上进行实验,结果表明,我们规划的轨迹在输入场景的旋转平移下稳定,验证了我们模型的等变性。尽管只使用了数据集的一小部分进行训练,但我们的方法在 3 秒内改善了 20.6%的 L2 距离,并超过了最先进的方法。
Mar, 2024
本研究介绍了一种无监督深度神经网络方法,用于融合 RGB-D 图像和惯性测量进行绝对轨迹估计。我们的网络在没有 IMU 固有参数或 IMU 与相机之间的外部校准的情况下进行学习,学习整合 IMU 测量并生成假设轨迹,然后根据空间像素坐标的缩放图像投影误差的雅可比矩阵进行在线更正。在 KITTI Odometry 数据集上与最先进的视觉惯性测距,视觉测距和视觉同时定位和地图构建(VSLAM)方法进行了比较,表现出有竞争力的测距性能。
Mar, 2018