全景深度预测
该研究提出了一种基于几何结构的无监督视觉深度学习方法,通过建模场景和物体,学习单目视频的摄像机姿态和物体运动,并引入在线细化方法,实现对未知域的实时适应。该方法优于现有技术,包括处理运动的技术,并可用于机器人导航领域的室内和室外场景。
Nov, 2018
提出了一种基于编码器-解码器网络的视频未来语义分割预测方法,使用先前的视频帧,仅利用RGB数据,利用知识蒸馏的训练框架预测未来场景的语义分割,并在Cityscapes和Apolloscape上取得了比基线和现有最先进方法更好的结果。
Apr, 2019
介绍了扩展了 nuScenes 数据集的大规模全景 nuScenes 基准数据集,以便对动态城市环境的全景场景理解方法进行研究和评估,同时提出了各种分割和跟踪任务的强基线方法,并提出了面向实例的新型 PAT 指标,解决了现有指标的局限性。
Sep, 2021
通过使用基于“差异关注”的变压器模型,全景分割预测模型联合预测场景中的所有对象实例,并考虑深度估计进一步优化预测结果,成功解决了当前全景分割预测模型独立预测和启发式合并预测所遇到的问题,实现了全景分割预测方面的最先进研究成果。
Apr, 2022
本文提出了一种深度感知全景分割(DPS)的统一框架,该框架通过应用动态卷积技术来解决全景分割和深度预测任务之间的互补关系,从而实现对单张图像进行实例级语义重建,通过实例级深度估计方案,为辅助监督深度学习而添加额外的实例级深度提示,实验结果表明该方法具有实用性和前景。
Jun, 2022
本研究提出了一种多任务循环架构的流和深度预测模型FLODCAST,通过训练使用流和深度地图的多个时刻一起进行预测,改善了两个任务的性能,并在Cityscapes数据集上获得了最先进的结果。
Oct, 2023
自我监督单目深度估计方法是用于自主车辆环境分析等关键应用的方法。该论文提出了MonoProb,这是一种新的无监督单目深度估计方法,返回一个可解释的不确定性,该不确定性反映了网络在深度预测中的期望误差。通过引入一种新的自训练损失,可提高深度和不确定性的性能。实验结果表明了我们方法在标准深度和不确定性指标以及我们设计的指标上的改进。
Nov, 2023