PCPNet:一种用于点云预测的高效语义增强变换网络
本文提出了一种使用 3D LiDAR 扫描来预测未来点云的方法,该方法可用于实现自主移动系统的预测状态估计、避碰和规划,通过使用 2D 范围图像表示扫描数据并连接一系列范围图像来实现端到端的预测,最终通过 3D 卷积来预测未来的 3D 点云,并通过多个数据集进行实验验证,结果表明本文提出的方法比现有的点云预测结构更优且能够很好地适用于新的未知环境。
Sep, 2021
本文提出了一种新颖的点云表示学习架构,称为 Dual Transformer Network (DTNet),该架构主要包括一个 Dual Point Cloud Transformer (DPCT) 模块,该模块通过同时聚合点和通道的多头注意力机制,从位置和通道的语义角度捕获更丰富的上下文依赖性,有效地实现了三维点云分类和分割任务中的终端到终端分析。
Apr, 2021
本文提出了一种名为 MoNet 的基于运动的神经网络,它将运动特征和内容特征结合起来用于预测未来的点云,以提高自动驾驶中智能汽车对其周围环境的感知和安全性。实验结果表明,该方法具有重要的应用前景。
Nov, 2020
由于视觉自主驾驶应用需要同时处理语义、3D 几何和时间信息以进行联合感知、预测和规划,因此我们提出了一种名为 “ViDAR” 的预训练模型,用于预训练下游视觉编码器,并通过新颖的隐变换操作将历史嵌入式表示转换为 3D 几何空间,以实现未来点云的预测。实验结果表明,在下游任务中取得了显著的增益,如在 3D 检测上的 NDS 提高了 3.1%,运动预测的错误率减少了约 10%,规划中碰撞率减少了约 15%。
Dec, 2023
本文提出了一种基于深度学习的点云局部三维形状属性估计方法 PCPNet,采用基于 patch 的学习方法,结合多尺度编码,能在强噪声和多尺度特征的情况下更好地估计法线及曲率等局部形状信息。我们的方法在结构化三角网格训练数据上训练,可以在处理噪声点云时得到比现有技术更好的结果,并成功在形状重构方面得到应用。
Oct, 2017
我们提出了一种新颖的图像辅助预训练框架 PRED,用于户外点云,以解决点云不完整性和遮挡对齐的问题,并通过神经渲染技术利用图像的语义信息进行监督。大规模数据集上的实验证明了 PRED 方法在 3D 感知任务中的显著优势。
Nov, 2023
使用 Transformer 从带有噪声和密度变化的点云中准确预测法线,在合成形状数据集 PCPNet 和真实世界室内场景数据集 SceneNN 上实现了最先进的性能,表现出更强的抗噪性和显著更快的推理速度,同时证明了现有工作中的复杂手工设计模块在表面法线估计任务中并非必需。
Jan, 2024
该研究提出了一种新的三维点云表示网络,称为动态聚类变换网络(DCTNet),它利用编码器 - 解码器架构来学习全局和局部特征,并提出了新的语义特征动态采样和聚类方法以及一个高效的语义特征引导上采样方法,验证了其在点云分割任务上的性能优于现有的最先进模型。
May, 2023
提出了一种高效的多任务架构 PAttFormer,在点云中实现联合语义分割和目标检测,相较于单一任务网络,不需要多个特定任务点云表示的独立特征编码器,结构更小更快,同时在自动驾驶感知领域的 nuScenes 和 KITTI 基准测试中实现了竞争性的性能,多任务学习表现出显著的增益。
Apr, 2024
提出了 PointGPT 方法来扩展 GPT 模型到点云中进行自回归生成任务的预训练,其通过多个点序列来实现学习潜在的表示,并在各种下游任务中实现了最先进的性能,特别是在 few-shot 学习方面也产生了新的 state-of-the-art 结果。
May, 2023