- 功能模块的特征图收敛评估
基于特征图分析的评估方法可以评估自主驾驶感知模型中功能模块的训练成熟度,提供了对功能模块进行独立评估的新方法。
- CVPRAIDE:用于自动驾驶中目标检测的自动数据引擎
我们提出使用视觉语言和大型语言模型的最新进展设计自动数据引擎(AIDE),以自动识别问题、高效筛选数据、通过自动标注改进模型,并通过生成多样化场景验证模型,从而实现模型的持续自我改进。我们还在自动驾驶数据集上建立了一个开放世界检测基准,全面 - 关于合成数据的等效性、可替代性和灵活性
通过实证研究,我们调查了合成数据在实际场景中的有效性,发现合成数据不仅提高了模型性能,而且在不损失性能的情况下能够替代真实数据,展示出在现实问题中采集真实数据的效率问题上合成数据的潜力,并证明了相对灵活的数据生成器对于提升模型适应性,缩小领 - 语义分割中的可靠性问题:我们能否使用合成数据?
本文挑战了最先进的生成模型,通过对稳定扩散进行微调,在语义分割方面自动生成合成数据以评估其可靠性。通过广泛实验,我们表明合成数据与真实异常数据的表现之间存在高度相关性,从而显示了该方法的有效性。此外,我们说明了如何利用合成数据来提高分割器的 - 自动驾驶中高效的目标检测:基于脉冲神经网络的性能、能耗分析以及开放集合对象发现的见解
此篇论文讨论了自动驾驶车辆场景图像数据中的物体检测建模任务中的性能、效率和开放域学习的问题,并证明了通过脉冲神经网络(SNNs)可以实现表现出色且高效的模型,与非脉冲神经网络相比,能够节省高达 85% 的能源消耗,并且在图像噪声下具有稍微改 - SiCP:面向联网和自动驾驶车辆的三维物体检测的同时个体和协作感知
通过提供一种名为 Simultaneous Individual and Cooperative Perception (SiCP) 的通用框架,该研究论文解决了合作感知领域的一个问题,即缺乏其他车辆共享特征图可能导致合作感知性能下降的困境 - LABELMAKER:从 RGB-D 轨迹自动生成语义标签
本文介绍了一种完全自动化的 2D/3D 标注框架,可以在无任何人为干预的情况下,为 RGB-D 扫描生成与可比较的手动注释的数据集(如 ScanNet)相同(或更高)准确度的标签,利用最先进的分割模型的集成和通过神经渲染进行的三维提升,我们 - UAV-Sim: 基于 NeRF 的无人机感知的合成数据生成
利用神经渲染的最新进展来改善从高空获取显著场景属性的静态和动态无人机图像合成,并且证明了将最先进的检测模型优化于真实和合成数据的混合数据集上,相比于仅使用真实或合成数据,可以达到显著的性能提升。
- ICCV基于强化学习的成像系统设计
通过将成像系统的四个组成部分组织成上下文无关语法(CFG),并通过学习的相机设计器,以任务特定的感知模型共同优化成像系统,我们展示了一种通过强化学习实现相机设计师的智能搜索策略,用于智能搜索可能成像系统配置的组合空间,以实现两个任务:深度估 - 基于激光雷达的语义分割中不确定性估计的校准
我们提出了一种测量语义分割模型对各个类别的置信度校准质量的度量标准,并使用该标准评估不平衡类别的不确定性估计方法的置信度校准情况。此外,我们还建议该方法可以自动发现标签问题,改善手工或自动注释数据集的质量。
- BEVControl: 通过 BEV 草图布局实现多透视一致性准确控制街景元素
使用合成图像来提升感知模型的性能是计算机视觉中长期存在的研究挑战,在多视角摄像头的视觉为中心的自动驾驶系统中变得更加突出,由于一些长尾场景无法收集。在 BEV 分割布局的指导下,现有的生成网络似乎在仅根据场景级度量进行评估时能够合成逼真的街 - AD-PT: 基于大规模点云数据集的自主驾驶预训练
通过构建大规模点云数据集,将点云预训练任务形式化为一种半监督问题,并从这样多样化的预训练数据中学习可推广的表示,从而在多个基准模型和基准测试中取得了显著的性能增益。
- 使用特征模仿交互式分割 NeRF
本论文研究了将语义特征应用于 Neural Radiance Fields(NeRF)以拓展其应用于实现复杂场景中物体的交互。研究提出了使用感知模型的主干特征,通过渲染语义特征,并仅应用感知模型的解码器,从而实现零样本语义分割的框架。同时可 - CVPR基于占据估计的汽车激光雷达自我监督
本论文提出一种基于自监督学习的点云深度感知模型预训练方法,通过表面重建预训练任务和基于潜在向量的感知头来抓取表面信息的语义片段并提高对象检测和场景语义分割性能。
- 自动驾驶一百万场景: ONCE 数据集
本文介绍了基于 ONCE (One millioN sCenEs) 数据集的 3D 物体检测,该数据集包含 1 百万个激光雷达场景和 7 百万对应的相机图像,以及对使用自我监督和半监督方法的基准测试和性能分析。
- SceneGen: 学习生成逼真交通场景
本文提出了一个名为 SceneGen 的神经自回归模型,可自动地生成真实交通场景,该模型可用于训练和测试自动驾驶车辆的感知模型。
- ICML基于语言和感知的属性学习联合模型
本文研究了语言基础问题,提出了一种联合学习语言和感知模型的方法,采用基于概率的范畴语法来构建丰富的、组合的含义表示,并且在物理场景下评估了该方法的性能,演示了准确的任务性能和有效的潜变量概念归纳。