基于注意力原型的无源迁移学习 3D 物体检测
MS3D++ 是一个用于 3D 目标检测的自我训练框架,通过生成高质量的伪标签实现多源无监督域适应,改进了 3D 检测器在不同领域中的泛化能力,并在 Bird's Eye View(BEV)评估中,使用 MS3D++ 伪标签训练的检测器在低密度和高密度 lidar 的性能上达到了与人工标注标签相媲美的最新水平。
Aug, 2023
本文提出了一种基于鲁棒学习思想的目标检测框架,通过使用在源领域上训练的检测模型获取目标领域的嘈杂标签数据,从而实现对所谓领域适应问题的处理。通过在 SIM10K、Cityscapes 和 KITTI 等数据集上的验证,将本文提出的方法与现有方法进行了比较,得出了它的显著提升。
Apr, 2019
通过系统调查四个在 3D 目标检测的鲁棒性和领域适应中常常被忽视的设计选择(架构、体素编码、数据增强和锚点策略)以及它们之间的相互作用,我们发现用本地点特征的 Transformer 主干比 3D CNN 更加鲁棒,在地理位置适应中关键是在测试时进行的锚点大小调整,源域数据增强允许模型推广到低分辨率传感器,而与预期相反,用干净的天气数据直接训练比用恶劣天气数据训练更能提高对恶劣天气的鲁棒性。我们总结了主要结论和发现,为开发更加鲁棒的 3D 目标检测方法提供实际指导。
Feb, 2024
提出了一种高效的概率框架,用于提取类别原型并将目标特征与其对齐,进而解决当前无监督域自适应方法中的采样可变性、类别不平衡和数据隐私问题,该方法适用于多种场景,包括单一源域,多源域,类别不平衡和源隐私域自适应,无需额外模型参数且计算量适中,在性能上达到了与现有最先进方法相媲美的水平。
Oct, 2021
提出了一种新的自我训练管道 MS3D,用于无监督领域适应的 3D 目标检测,其使用不同的预训练探测器结合时间信息生成高质量的伪标签进行微调。使用我们提出的核密度估算(KDE)盒融合方法来融合来自多个域的盒子提议,以获得超过最佳源域探测器性能的伪标签。MS3D 表现出更大的领域位移鲁棒性,并能够在较大距离上产生准确的伪标签,因此非常适合从高到低波束领域适应和反之。该方法在所有评估数据集上都取得了最先进的性能,而且我们证明了预先训练源探测器的选择对自我训练结果影响较小,因此 MS3D 适用于实际应用。
Apr, 2023
利用空间几何对齐和时间运动对齐构建自适应域归一化方法,以头显和机械扫描激光雷达的点云数据为例,实现了跨设备 3D 检测的最新性能水平。
Dec, 2022
本研究提出了一种新的学习方法通过在原始领域的伪标签上微调探测器来减少自动驾驶汽车在不同环境下的识别差异,据此,研究发现在五组自动驾驶数据集中,探测器在伪标签领域上的微调显著降低了探测器在新的行驶环境中的误判率。
Mar, 2021
自动驾驶中的 LiDAR 数据集存在诸如点云密度、范围和物体尺寸等属性偏差,因此在不同环境中训练和评估的物体检测网络往往会遇到性能下降的问题。为了解决这个问题,域自适应方法假设可以获取来自测试分布的未标注样本。但是,在实际世界中,部署条件和获得代表测试数据集的样本可能无法获得。我们认为,更现实和具有挑战性的形式是要求对未知目标域具有性能的鲁棒性。我们提出了一种双重方式来解决这个问题。首先,我们利用大多数自动驾驶数据集中存在的配对的 LiDAR - 图像数据进行多模态物体检测。我们建议通过利用图像和 LiDAR 点云的多模态特征来进行场景理解任务,从而使得物体检测器对未知域的转换更加鲁棒。其次,我们训练一个 3D 物体检测器,在不同分布之间学习多模态物体特征,并促进这些源域之间的特征不变性,以提高对未知目标域的泛化性能。为此,我们提出了 CLIX$^ ext {3D}$,它是一个用于 3D 物体检测的多模态融合和有监督对比学习框架,它在对不同数据集转换下实现了最先进的域泛化性能。
Apr, 2024
本文提出了 SF-UDA^3D 框架,基于伪标注、可逆的尺度转换和运动相干性,将最先进的 PointRCNN 3D 检测器域自适应到无注释目标域中,结果在 KITTI 和 nuScenes 上都优于以前的特征对齐方法和最先进的 3D 目标检测方法。
Oct, 2020
通过利用未标记的多次穿越多个位置的方法,我们提出了一种用于自动驾驶汽车的 3D 物体检测系统的快速发展,该方法能够适应新的驾驶环境,并且在检测行人和远处物体方面取得了显著的性能提升。
Sep, 2023