Dec, 2020

ViP-DeepLab:深入学习基于深度感知的全景视频分割的视觉感知

TL;DRViP-DeepLab 是一种联合模型,尝试解决视觉中长期存在且具有挑战性的逆投影问题。该模型通过联合执行单眼深度估计和视频全景分割来处理该问题,并提供每个点的实例级语义解释。在子任务中,ViP-DeepLab 也取得了最先进的结果,在 Cityscapes-VPS 中超越以前的方法 5.1% VPQ,在 KITTI 单眼深度估计基准测试中排名第一,在 KITTI MOTS 中排名第一。