主动式 3D 建图学习
本研究提出了一种主动学习的方法,通过使用 RGB 图像生成的 2D 区域提案来减少目标搜索空间并加快学习过程,从而训练一个具有最少标记训练数据的 LiDAR 3D 目标检测器。实验结果表明,该方法在不同的不确定性估计和查询功能下都能正常工作,并可以节省多达 60% 的标注工作量,同时达到相同的网络性能。
Jan, 2019
本研究提出了一种新颖的实时伪深度引导深度补全神经网络 DenseLiDAR,利用形态操作得到的稠密伪深度图在三个方面指导网络,取得了最先进的性能,并在 KITTI 3D 对象检测数据集上实现了 3-5%的性能提升,这说明了深度完成结果可以用于改善相关下游任务的潜力。
Aug, 2021
该论文提出一种在机器人应用中提高单目深度估计精度的方法,通过残差神经网络,以 2D 激光测距仪的观察为基础,结合分类和回归损失进行连续深度估计,在障碍物避免中具有潜在的应用价值。
Oct, 2016
本文提出了一种使用基于 Octree 的结构并采用神经网络处理隐式特征进行 LiDAR 测量的大规模三维重建方法,并利用二进制交叉熵损失来优化局部特征。在此基础上,设计出一种具有正则化性能的增量式映射系统,以解决连续学习中遗忘问题。实验结果显示,本方法相较其他先进技术具有更高的精确性、完成度和内存效率。
Oct, 2022
该研究论文利用学习到的紧凑深度图表示和重构三种不同类型的误差,将光度误差,重投影误差和几何误差应用于标准因子图软件中,将不同的方法统一到概率框架中,实现实时性能的同时对现实世界序列的轨迹估计和深度重建进行评估,并呈现了估计的丰富几何示例。
Jan, 2020
利用多模态数据结合深度学习模型进行密集三维重建,从而提高自动驾驶中的标注验证、数据扩充、缺失 LiDAR 系统的地面真值注释以及自动标记准确性的应用效果。
Feb, 2024
本研究提出了一种深度估计方法,利用来自双目立体视觉和稀疏激光雷达或深度相机的测量信息。通过融合各传感器的优势,即精确但稀疏的测量信息和模糊但密集的立体信息,并采用各向异性扩散和半全局匹配技术进行有效地融合。该方法在 KITTI 2015 和 Middlebury 2014 数据集上评估,表现显著,而且使用 PMDTec Monstar 传感器提供了定量结果。
Sep, 2018
本研究提出了一种深度模型,能在极少的像素点处获得 RGB 图像的已知深度情况下,精确地生成密集深度图,并能在 NYUv2 和 KITTI 数据集上实现近乎实时速度的室内 / 室外场景的高质量深度点云。与其他稀疏到密集深度方法相比,在每~10000 个像素中仅有一个像素的情况下,我们的深度估计准确度比现有最新算法还要高,仅在图像 1/256 的像素上估计,我们的精度就相当于消费级深度传感器的性能,本研究说明了将稀疏深度测量(如低功率深度传感器或 SLAM 系统获得)高效地转换成高质量的密集深度图是完全可能的。
Apr, 2018
本研究提出了一种基于分层优化的 3D SLAM 方法,通过子图的建模和图优化,解决了 3D 激光扫描仪的漂移和测量不准确性问题,并使用熵衡量地图质量。
Oct, 2018
本文提出了一种新颖的半监督主动学习 (SSAL) 框架,用于配备了激光雷达的单目 3D 物体检测,利用了模型开发过程中所收集的所有数据的多模态。通过利用激光雷达来指导单目 3D 检测器的数据选择和训练,不在推理阶段引入任何开销,并采用半监督学习中的激光雷达教师,单目学生交叉模态框架,用于从未标记数据中蒸馏信息作为伪标签,以处理传播噪声等问题。文中也给出了用于选择需标记样本的传感器一致性基础选择评分的解决方案,同时也符合训练目标。本文在 KITTI 和 Waymo 数据集上广泛实验,验证了所提出方法的有效性。具体来说,所提出的选择策略在成本节省方面始终优于现有主动学习基线,在标签成本上节约了高达 17% 的成本;训练策略在 KITTI 3D 和 BEV 单目物体检测官方基准中获得了最佳成绩,将 BEV 平均精度提高了 2.02。
Jul, 2023