全景深度预测

Sep, 2024

Panoptic-Depth Forecasting

Juana Valeria Hurtado, Riya Mohan, Abhinav Valada

TL;DR本研究解决了机器人在导航和规划安全行为时，语义和3D结构预测的不足，尤其是几何信息的缺失。我们提出了一种全景深度预测任务，以从单目相机图像中联合预测未来未观察帧的全景分割和深度图，并开发了新的评估指标来量化预测质量。研究表明，我们的PDcast架构在两个数据集和三个预测任务中的表现卓越，具有重要的应用潜力。

Abstract

Forecasting the semantics and 3D structure of scenes is essential for robots to navigate and plan actions safely. Recent methods have explored semantic and panoptic scene forecasting; however, they do not consider the geometry of the scene. In this work, we propose the panoptic-depth forecasting task for jointly predicting the panoptic segmentation and depth

发现论文，激发创造

单目深度图预测的半监督深度学习

本文提出了一种半监督学习的深度学习方法，通过稀疏的真实深度数据和直接图像对齐误差来学习单目图像深度地图的预测，实验结果表现出一定的优越性。

Feb, 2017

无需传感器的深度预测：利用结构从单目视频中进行无监督学习

该研究提出了一种基于几何结构的无监督视觉深度学习方法，通过建模场景和物体，学习单目视频的摄像机姿态和物体运动，并引入在线细化方法，实现对未知域的实时适应。该方法优于现有技术，包括处理运动的技术，并可用于机器人导航领域的室内和室外场景。

Nov, 2018

未来分割

提出了一种基于编码器-解码器网络的视频未来语义分割预测方法，使用先前的视频帧，仅利用RGB数据，利用知识蒸馏的训练框架预测未来场景的语义分割，并在Cityscapes和Apolloscape上取得了比基线和现有最先进方法更好的结果。

Apr, 2019

全景分割预测

通过场景分解，从背景和前景分别预测背景的运动和物体的运动，我们提出了全景分割预测，可以在已有模型的基础上实现背景与物体的双重预测，比现有的基线模型性能更好。

Apr, 2021

Panoptic nuScenes：LiDAR 全图分割和跟踪的大规模基准测试

介绍了扩展了 nuScenes 数据集的大规模全景 nuScenes 基准数据集，以便对动态城市环境的全景场景理解方法进行研究和评估，同时提出了各种分割和跟踪任务的强基线方法，并提出了面向实例的新型 PAT 指标，解决了现有指标的局限性。

Sep, 2021

带有差异性注意力的全景分割联合预测

通过使用基于“差异关注”的变压器模型，全景分割预测模型联合预测场景中的所有对象实例，并考虑深度估计进一步优化预测结果，成功解决了当前全景分割预测模型独立预测和启发式合并预测所遇到的问题，实现了全景分割预测方面的最先进研究成果。

Apr, 2022

PanopticDepth: 一个统一的深度感知全景分割框架

本文提出了一种深度感知全景分割(DPS)的统一框架，该框架通过应用动态卷积技术来解决全景分割和深度预测任务之间的互补关系，从而实现对单张图像进行实例级语义重建，通过实例级深度估计方案，为辅助监督深度学习而添加额外的实例级深度提示，实验结果表明该方法具有实用性和前景。

Jun, 2022

FLODCAST：多模态递归架构中的流量和深度预测

本研究提出了一种多任务循环架构的流和深度预测模型FLODCAST，通过训练使用流和深度地图的多个时刻一起进行预测，改善了两个任务的性能，并在Cityscapes数据集上获得了最先进的结果。

Oct, 2023

MonoProb: 解释性的无监督单目深度估计与不确定性

自我监督单目深度估计方法是用于自主车辆环境分析等关键应用的方法。该论文提出了MonoProb，这是一种新的无监督单目深度估计方法，返回一个可解释的不确定性，该不确定性反映了网络在深度预测中的期望误差。通过引入一种新的自训练损失，可提高深度和不确定性的性能。实验结果表明了我们方法在标准深度和不确定性指标以及我们设计的指标上的改进。

Nov, 2023

从4D动态点云序列进行语义完整场景预测

我们研究了语义完整场景预测（SCSF）的新问题，通过一个名为SCSFNet的新型网络，我们能够准确地预测未来帧的完整场景以及其语义标签。

Dec, 2023