- CVPRMULi-Ev:保持未受干扰的 LiDAR 事件校准
MULi-Ev 是首个基于深度学习的在线框架,专为事件相机和 LiDAR 的外部校准而设计,通过实时校准调整来维持传感器对准度,在自动驾驶中能够实现 LiDAR 和事件相机的无缝集成,提高校准准确性,并在移动平台上树立了集成 LiDAR 和 - 自动驾驶系统感知测试中寻找相关图像的最佳点位
基于神经网络的自动驾驶系统感知图像检测方法,通过自动化阈值定义来提供与输入提示相关的图像结果,以防止误报和误检。
- 基于深度集成的自适应巡航控制的感知不确定性自动驾驶
我们在这篇论文中开发了一个基于深度神经网络的集成回归器,用于自适应巡航控制中估计与前车的车头距离,并通过概率安全约束来实现跟踪速度和保持安全跟车距离的目标。
- PreSight:在城市尺度上利用 NeRF 先验增强自主车辆感知
基于人类的认知方式,我们引入了一种名为 Pre-Sight 的新框架,通过过往的行程生成静态的先验记忆来增强后续导航的实时感知,优化了城市规模的神经辐射场,生成富有语义和几何细节的神经先验。在自动驾驶系统中,该框架展现出了显著的 HD 地图 - 基于 2D 物体边界框的路径规划
基于视觉为中心的自动驾驶是一种有前景的替代方法,该研究提出了一种路径规划方法,通过在城市驾驶场景中使用由高清地图数据和环绕摄像机捕获的图像生成的二维边界框,通过图神经网络和 Transformer 实现局部嵌入和全局嵌入来获得最佳路径规划信 - 冰冷月球表面模拟与采样自主性的立体深度估计
为了解决冰卫星着陆任务中的采样自主性问题,我们提出了图形化工具用于冰卫星表面模拟 (GUISS) 框架,用于生成深度估计的立体数据集,并评估了传统和深度学习算法在不同的可视化假设下的性能。
- 分析和减轻弱势群体偏见:迈向数据集的平衡代表性
通过对脆弱道路用户的分类不平衡、性能评估和偏见影响评估进行研究,我们提出了一种模型优化和偏见缓解的方法,包括数据增强、重采样和度量特定学习,以改善自动驾驶中感知系统的准确性和公正性。
- TULIP:用于 LiDAR 点云上采样的变形器
TULIP 是一种用于从低分辨率 LiDAR 输入中重建高分辨率 LiDAR 点云的新方法,通过修改基于范围图像的 Swin-Transformer 网络的补丁和窗口几何形状,以更好地适应范围图像的特性,TULIP 在所有相关指标上优于最先 - DARTH:针对多目标追踪的整体测试时适应
这篇论文研究了多目标跟踪的测试时间域偏移问题,并引入了 DARTH,一个全面的测试时间适应框架。通过引入检测一致性公式和新颖的补丁对比损失,我们成功适应了目标检测和实例外观表示,在多个领域转移情况下取得了显著性能提升。
- 城市场景中的全景 3D 到 2D 标签转移:PanopticNeRF-360
利用粗糙的三维注释和有噪音的二维语义线索结合,从任意视角生成一致的全景标签和高质量图像。
- 自主驾驶的空间编码传感器融合
该论文介绍了一种使用 Transformer 模块在多个分辨率上有效合并局部和全局上下文关系的相机和 LiDAR 数据融合方法,并通过与两个具有长途路线和高密度交通的对抗基准的广泛实验证实了该方法的性能优势。与之前的方法相比,该方法在最具挑 - LISA:利用大型语言模型进行分割推理
该研究提出了一种新的推理分割任务,以激活感知系统中的推理分割能力,并展示了多模态语言模型 LISA 在复杂推理分割和标准引用分割任务中的有效性。
- 感知系统安全要求的高效确定
本文提出了一种名为 “平滑强盗” 的新方法,利用黑盒模拟器的优势,有效确定满足安全要求的感知系统的性能特征,以视觉为基础的飞机避撞问题的实验证明了该方法的精确性和效率优于高斯过程和阈值强盗基线。
- 基于 AI 的多传感器融合系统鲁棒性基准测试:挑战与机遇
本文提出了一个针对多传感器融合技术 (MSF) 的公共基准测试,包括目标检测、目标追踪和深度完成三个任务,并基于此设计了 14 个常见和实际的数据破坏模式,通过大规模的评估揭示了当前基于人工智能的 MSF 感知系统的脆弱性和不可靠性,提出了 - 多目标动态三维形状重建、6 自由度位姿估计和密集抓取预测实时同时完成
本文介绍了一种新的方法,通过感知系统提供场景中所有物体的几何和语义信息,同时提供这些物体的可行抓取,以加速机器人操作的复杂度。通过详细的定量分析,我们展示了我们的方法通过在 30 帧 / 秒速度下提供竞争性能,以比较专门用于物体形状、姿态和 - PixelRNN: 像素内循环神经网络用于端到端优化的神经感知
本文提出了一种基于二进制操作的有效循环神经网络架构 PixelRNN,利用新型图像传感器的编程能力和最小处理能力直接在传感器上对时空特征进行编码,相对于传统系统,PixelRNN 将需要传输的数据量降低了 64 倍,同时在手势识别和读唇任务 - WOMD-LiDAR: 运动预测原始传感器数据集基准
通过使用高质量 LiDAR 数据增强 Waymo Open Motion Dataset (WOMD) 并将其整合到模型训练中,实验结果表明 LiDAR 数据的使用能够提高运动预测任务的性能,为推动端到端运动预测模型提供新机会。
- CVPR学习缩放与取消缩放
本文介绍了一种新的算法 LZU,通过在输入图像上进行学习来计算空间特征并最终消除任何形变,使得可以应用于任何具有 2D 空间输入的任务和任何具有 2D 空间特征的模型,并通过在不同任务和数据集上的评估来展示其可用性。
- RadSegNet: 一种可靠的雷达与相机融合方法
该研究论文提出了一种新的相机 - 雷达融合系统 RadSegNet,通过独立信息提取的设计哲学,从根本上解决了现有系统在极端天气下的性能劣化,提高了自主驾驶汽车在恶劣天气条件下的工作效率。
- 感知系统监测:基于确定性、概率性和基于学习的故障检测与识别
本文研究了感知系统的运行时监测,提出了一个基于诊断图的故障检测和识别框架,并提供了一系列基于诊断图的算法来执行故障检测和识别。通过实验证明提出的系统监控具有潜在的在现实自动驾驶场景中预防事故的能力,并且计算负载极小。