驾驶场景感知网络:实时联合检测、深度估计和语义分割
本论文提出了一种联合多任务网络设计,用于同时学习目标检测和语义分割,以实现低功耗嵌入式 SOC 上的实时性能,并在两个公共数据集(KITTI,Cityscapes)和私人鱼眼相机数据集中评估提出的网络。
Jan, 2019
提出了一组高效的卷积神经网络骨干架构,通过双分辨率融合和深度上下文聚合金字塔池化模块,实现了在 Cityscapes 和 CamVid 数据集上的优于现有模型的精度和速度的实时语义分割。
Jan, 2021
本文提出了一种强大且高效的深度神经网络驾驶场景语义分割模型 DSNet,通过 ShuffleNet V2 和 ENet 的启发式设计,以及实现的 Driving Importance-weighted Loss 作为考虑驾驶决策的重要因素,等方面提高准确率和实时性。在 Cityscapes 数据集上的实验结果表明 DSNet 比 ENet 的准确率提高了 18.9%,速度提高了 1.1 倍,具有应用于自动驾驶的巨大潜力。
Dec, 2018
论文提出了一种同时预测深度估计和语义分割输出的 CNN 模型,通过对单目输入图像进行实验,我们证明了该模型对于场景理解和深度估计能力达到了最新的研究水平。
Jul, 2019
利用深度学习模型在机器人中作为感知信息提取器的部署,有许多困难之处。本文着重探讨了其中三个最显著的障碍,即如何将单个模型适应于同时执行多个任务的需求、如何实现实时性、以及如何使用具有不对等标注数量的非对称数据集。通过使用实时语义分割网络和知识蒸馏的简单解决方案,我们将这些障碍一一克服。最终,我们的系统可以方便地扩展,使用单个模型同时处理更多任务和未来更多的数据集,能够在室内和室外分别执行深度估计和分割,并在 640x480 像素的输入上只需要一个前向通道即可实现 13ms 和 6.5 GFLOPs 成本的效果,从而直接将其用于场景的 3D 语义重建中。
Sep, 2018
本文提出了一种联合分类、检测和语义分割的方法,其中编码器在三个任务之间共享。该方法非常简单,可以端到端训练,在具有挑战性的 KITTI 数据集中表现良好,在道路分割任务中优于现有技术。而且,我们的方法非常高效,执行所有任务只需要不到 100 毫秒。
Dec, 2016
本文提出了一种名为 RFNet 的实时融合语义分割网络,该网络可在自动驾驶汽车应用中快速运行,利用多个数据集进行训练,实现对意外小障碍的识别和面对现实世界中未预见到的危险,达到了显著的分割精度和 22Hz 推理速度。
Feb, 2020
通过提供一种名为 Simultaneous Individual and Cooperative Perception (SiCP) 的通用框架,该研究论文解决了合作感知领域的一个问题,即缺乏其他车辆共享特征图可能导致合作感知性能下降的困境,并提出了一种新颖的双感知网络(DP-Net)来增强独立和合作感知模型的性能。
Dec, 2023