MoNet:基于动作的点云预测网络
本文提出了一种高效的深度学习模型 MotionNet,通过 LiDAR 扫描的数据实现自动驾驶中的感知和运动预测,该模型基于一种新颖的时空金字塔网络,可以提取深层次的时空特征,并且通过空间和时间一致性约束进一步规范了模型的训练。实验证明,该方法的性能明显优于现有的基于场景流和 3D 目标检测的方法,有望在自动驾驶中提供备用方案和对运动规划员提供补充信息。
Mar, 2020
本文提出了一种名为 MeteorNet 的神经网络结构,用于学习动态 3D 点云序列的表示,该网络直接处理点云序列并构建了两种构建时空邻域的方法,表现优于传统基于网格的方法且达到了先进水平。这是深度学习方面对于动态原始点云序列的首次研究。
Oct, 2019
PointTrackNet 使用机器学习技术构建一个端到端的 3D 目标检测和跟踪网络,在处理极端运动状态下的 KITTI 跟踪数据集时表现卓越。
Feb, 2020
该论文提出了一种使用深度神经网络从非结构化点云中估计三维运动的方法,同时也能预测场景中物体的三维边界框和刚体运动。作者还采用虚拟物体增强真实扫描数据来训练网络,并与传统技术和基于学习的技术进行了全面比较。
Jun, 2018
提出一种端到端学习网络,用于预测点云序列中的未来帧,其中网络以点云的拓扑信息作为几何特征学习初始层,形成代表性的时空邻域,在多个 Graph-RNN 单元中学习点的动态(即 RNN 状态),并与时空邻近点一起处理。测试结果表明,我们的方法在忽略几何特征信息的基准线方法上表现出色,应用于包括 MINST 运动数字、合成人体动作和 JPEG 动态人体数据集的预测中。
Feb, 2021
本文提出了一种新的实时方法,基于三维点云序列,采用时间上下文聚合实现动态检测和运动参数估计,可适用于自动驾驶车辆在复杂城市环境下进行安全导航,不仅可以估计车辆或行人等常见道路参与者的运动,还可推广到其他没有在训练数据中出现的物体类别,并对不同的时间上下文聚合策略进行了深入的分析,提供了我们最先进模型与 KITTI 场景流数据集上现有解决方案的比较结果。
Apr, 2020
本文提出一种新的高效 Transformer-based 的点云预测网络,并设计了语义辅助训练策略来对未来的 LiDAR 点云进行预测,该方法是完全自监督的,并且在预测结果和语义相似性上表现出超越最先进的 PCP 方法的性能,具有良好的实时性能。
Apr, 2023
本研究提出了一个新的多视图视觉提示融合网络 (MvNet),通过利用现成的 2D 预训练模型实现 few-shot 3D 点云分类,实现了 3D few-shot 点云图像分类的最新性能。
Apr, 2023
本文提出了一种基于卷积神经网络的简单而强大的多模态运动预测基准线,与最先进方法相比,具有竞争性的性能,并且在 2021 年 Waymo 开放数据集运动预测挑战赛上排名第三。
Jun, 2022
提出一种新颖的面向智能驾驶系统中的多模态运动预测的代理中心模型,并结合锚定地标、融合多样化提案的方法,实现了未来轨迹的精准预测,网络结构均相并且简明,可靠且高效。实验证明,该代理中心无论从预测精度还是从情境级别推断延迟方面均优于当前最先进的方法。
Mar, 2023