利用循环神经网络在 3D 点云中分类物体:一种 GRU LSTM 混合方法
本文提出了一种基于稀疏 LSTM 的多帧 3D 对象检测算法,使用 U-Net 风格的稀疏 3D 卷积网络提取每帧 LiDAR 点云的特征,并将这些特征与上一帧的隐藏和记忆特征一起输入到 LSTM 模块中,以预测当前帧中的 3D 对象,同时传递给下一帧的隐藏和记忆特征。实验结果表明,我们的算法在使用更少的内存和每帧计算的情况下优于传统的逐帧方法 7.5% [email protected] 和其他多帧方法 1.2% 。据我们所知,这是在稀疏点云中首次使用 LSTM 进行 3D 对象检测的工作。
Jul, 2020
该研究介绍了使用递归的几何感知神经网络,将一个场景的多个视图中的视觉信息整合到 3D 潜在特征张量中,并直接使用构建的 3D 特征存储器进行物体检测、物体分割和 3D 重建。
Nov, 2018
本研究提出一种新的两阶段方法,其中包括点云完成模块以恢复高质量的点密集提案和整个视图,同时设计了图神经网络模块,实现了全局本地关联机制和多尺度图形的上下文聚合,显著强化编码特征,实验表明,所提出的方法在 KITTI 基准测试中优于之前的基线算法,突出了其有效性。
Dec, 2020
本研究提出了一种基于图神经网络的 LiDAR 点云对象检测方法,采用自动注册机制降低了平移方差,并结合盒子合并和计分运算从多个数据点准确地组合检测结果,在 KITTI 基准测试中,该方法仅使用点云即可实现领先的准确性,甚至胜过融合算法,这显示了使用图神经网络作为三维对象检测的新方法的潜力。
Mar, 2020
提出一种端到端学习网络,用于预测点云序列中的未来帧,其中网络以点云的拓扑信息作为几何特征学习初始层,形成代表性的时空邻域,在多个 Graph-RNN 单元中学习点的动态(即 RNN 状态),并与时空邻近点一起处理。测试结果表明,我们的方法在忽略几何特征信息的基准线方法上表现出色,应用于包括 MINST 运动数字、合成人体动作和 JPEG 动态人体数据集的预测中。
Feb, 2021
本研究提出了一种融合 3D 卷积神经网络 (CNN)、深度 Q 网络 (DQN) 和残差循环神经网络 (RNN) 的方法,对大规模三维点云进行高效的语义解析,取得了优于现有方法的分类结果。
Jul, 2017
本文采用多帧点云视频中的时间信息来探测 3D 物体。研究者们提出了一种名为 GMPNet 的格网信息传递网络来编码短期时间信息,并提出了一个名为 AST-GRU 的基于注意力的时空变换 GRU 来进一步聚合长期帧。在 NuScenes 基准测试中,该方法表现优异,且不需要任何额外的手段。
Jul, 2022
本文研究基于点云数据的深度学习技术在解决三维计算机视觉领域中的经典问题方面的应用。作者介绍了 ScanObjectNN 数据集并展示了其对于点云对象分类问题的挑战性,提出了三个关键的挑战问题,并提出了一些解决方案,最终实现了在背景杂乱的情况下对于点云对象的分类,达到了最佳效果。
Aug, 2019
该论文讨论了自动驾驶汽车中的 3D 环境理解和解释问题,提出了一种基于递归分割架构的方法,该方法将时间序列信息与语义学信息相结合,充分利用了时间信息,提高了分割结果的准确性和效率。
Mar, 2021