VALO：一种多功能实时光学雷达目标检测框架

Sep, 2024

VALO：一种多功能实时光学雷达目标检测框架

VALO: A Versatile Anytime Framework for LiDAR-based Object Detection Deep Neural Networks

Ahmet Soyyigit, Shuochao Yao, Heechul Yun

TL;DR本研究解决了在光学雷达目标检测深度神经网络中动态截止时间要求适应的问题。我们提出了VALO，一种数据驱动的方法，通过截止时间感知调度器优化检测的执行时间和准确率，同时引入的新输入减少技术显著提升了执行速度。实验证明，VALO在满足各种时间约束的情况下，比现有技术具有更高的准确性。

Abstract

This work addresses the challenge of adapting dynamic deadline requirements for LiDAR Object Detection Deep Neural Networks (DNNs). The co

发现论文，激发创造

LaserNet: 高效的概率三维物体检测器，用于自动驾驶

本文提出了LaserNet，一种3D物体检测的计算有效方法，它通过在传感器的本地范围视图中处理LiDAR数据来提高效率，并使用全卷积网络来预测每个点的3D框的多模式分布，然后高效地融合这些分布以生成每个对象的预测，实验证明这种方法比其他方法具有显著更低的运行时间，并且在大型数据集上具有比其他检测器更好的性能。

Mar, 2019

基于流式处理的三维点云目标检测

探索如何建立一种去除人工延迟限制的目标检测器，而是在流数据上运作来显着降低延迟，该方法有助于减少推理硬件的峰值计算负载，同时实现竞争性甚至优越的预测性能。

May, 2020

CLOCs: 用于3D物体检测的相机-LiDAR物体候选融合

该研究提出了一种新的相机-激光雷达物体候选（CLOCs）融合网络，可以显著提高单模态检测器的性能，通过将 2D 和 3D 检测器的相互一致性与几何和语义一致性相结合，产生更准确的最终 2D 和 3D 检测结果，并在 KITTI 目标检测基准中展示出显着的改进。

Sep, 2020

不是所有点都相同：学习针对3D LiDAR点云的高效点检测器

本文提出了一种高效的基于点云的3D检测器IA-SSD，利用可学习的面向任务的实例感知下采样策略分层选择感兴趣物体的前景点，进一步估计精确的实例中心，并采用仅编码器架构实现。大规模检测基准测试表明，该模型具有卓越的速度性能，能够以80个以上的速度在KITTI数据集上进行实时检测。

Mar, 2022

Anytime-Lidar：面向截止时间的3D物体检测

本文提出了一种新颖的调度框架，能够让基于深度神经网络（DNN）的3D物体检测管道具有实时感知能力。我们关注计算密集型的区域提案网络（RPN）和异类多头探测器组件，该框架能够使它们具备可感知截止期限的能力。我们提出了一种调度算法，可以智能地选择子组件的子集，从而在运行期间实现时间和精度之间的有效权衡。同时，本文通过估计，将先前检测到的物体投射到当前场景中，以最小化跳过一些神经网络子组件而损失精度。此外，我们将该方法应用于一个最先进的3D物体检测网络PointPillars，并使用根据nuScenes数据集评估其在Jetson Xavier AGX上的性能。与基线相比，本文的方法显着提高了网络在各种截止期限下的精度。

Aug, 2022

LidarNAS: 为三维点云统一和搜索神经结构

为了成功实现机器人技术和自动驾驶，开发能够准确理解3D点云中对象的神经模型至关重要。本文提出了一个统一的框架来因素分解神经网络，并演示了这种模块化框架作为神经架构搜索空间的可行性，并在3D物体检测上优于现有模型。

Oct, 2022

MGTANet：使用长短期运动引导时间注意力编码顺序LiDAR点以进行3D物体检测

本文提出了一种新的三维物体检测结构，该结构可以编码由多个连续扫描获取的LiDAR点云序列，并利用时空上下文实现较大的性能提升。通过短期运动感知体素编码和长期运动指导俯视图特征增强，可以对点云序列进行编码处理，结果显示，与基线方法相比，该模型在性能上显示出明显优越性，在某些三维检测类别方面表现出了最先进的性能。

Dec, 2022

一旦检测到即无法丢失：离线激光雷达三维目标检测超越人类表现

本文旨在提高离线基于LiDAR的三维物体检测的性能，提出了一种新的基于轨道中心的检测器CTRL，并设计了一个双向跟踪模块和一个轨道中心学习模块，实现了“一旦检测，永不失误”的特征。大量实验表明，我们的方法在竞争激烈的Waymo Open数据集中超越了人类注释的准确性和以往最先进的方法。

Apr, 2023

LiDAR-BEVMTN：用于自动驾驶的实时激光雷达鸟瞰式多任务感知网络

LiDAR在自动驾驶中具有重要作用，本文提出了一种基于LiDAR的实时多任务卷积神经网络，用于对象检测、语义分割和运动分割，并在汽车级嵌入式平台上实现了3ms延迟，取得了语义分割和运动分割的最新成果以及3D物体检测的接近最新成果。

Jul, 2023

LEF: 后期-早期时序融合在LiDAR 3D目标检测中的应用

我们提出了一种基于时间LiDAR点云的迟到提早循环特征融合方案，用于3D物体检测。我们的主要动机是将物体感知的潜在嵌入融合到3D物体检测器的早期阶段。这种特征融合策略使模型能够更好地捕捉具有挑战性的物体的形状和姿态，相比直接从原始点学习。我们的方法以循环的方式进行迟到提早特征融合。这是通过在时间上校准和对齐的稀疏柱状令牌上施加基于窗口的注意力块来实现的。利用俯视图前景柱状分割，我们将模型需要融合到当前帧中的稀疏历史特征数量减少了10倍。我们还提出了一种随机长度的FrameDrop训练技术，它在推断时可以依据可变帧长度来改进性能而无需重新训练。我们在广泛采用的Waymo Open Dataset上评估了我们的方法，并证明在3D物体检测方面相对于基线模型有所改进，特别是对于挑战性的大物体类别。

Sep, 2023