使用共同的多尺度卷积结构预测深度,表面法线和语义标签
本研究采用多尺度卷积神经网络,提出一种单一 RGB 图像用于深度估计和语义分割的深度学习模型,该模型采用单一损失函数进行训练,同时使用完全连接的 CRF 捕捉语义和深度线索之间的上下文关系和交互作用,实现更精确的结果。在 NYUDepth V2 数据集上进行实验,该模型在语义分割方面表现优于最先进方法,在深度估计任务上实现可比较的结果。
Apr, 2016
本论文介绍了一种用于深度估计和语义分割的神经网络框架设计,分析了深度和语义预测图之间的交叉模态影响,并提出了平衡交叉模态影响以实现更好精度的方法。通过提出的 CNN 架构,达到了在 NYU-Depth v2 基准测试中,同时提高深度估计和语义标记的结果的目的。
Feb, 2017
本文提出了一种新的方法,利用两个深度网络堆栈来解决单张图像深度估计的问题,并应用尺度不变误差来测量深度关系,通过利用原始数据集作为大量训练数据,方法在 NYU Depth 和 KITTI 上实现了最先进的结果。
Jun, 2014
本文提出了一种特别为密集预测设计的新的卷积网络模块,该模块利用扩张卷积系统地汇集多尺度上下文信息,而不会丢失分辨率,并证明了该模块可以提高现有最先进的语义分割系统的精度。同时,作者还探究了将图像分类网络适应于密集预测的可能性,并提出了简化适应后的网络结构有助于提高精度。
Nov, 2015
通过采用分层抽样和多尺度特征的方法,优化以卷积预测器为基础的像素级预测问题的神经网络结构,显著提高了模型在低级边缘检测、中级表面法线估计和高级语义分割中的性能.
Sep, 2016
采用多尺度卷积神经网络直接从图像和深度信息中学习特征实现室内场景的多类别分割,并在 NYU-v2 深度数据集上取得了 64.5% 的准确率,充分说明了适当的硬件(如 FPGA)可以实现实时处理。
Jan, 2013
本文介绍了一种网络架构,利用位于解码阶段多个阶段的新型本地平面指导层来更有效地引导密集编码特征以进行所需的深度预测, 并在具有挑战性的基准测试中通过消融研究证明所提出的方法优于最先进的作品。
Jul, 2019
论文提出了一种同时预测深度估计和语义分割输出的 CNN 模型,通过对单目输入图像进行实验,我们证明了该模型对于场景理解和深度估计能力达到了最新的研究水平。
Jul, 2019
本文提出了一种新颖的注视模型用于语义分割,该模型聚合了多尺度和上下文特征进行预测。该模型使用骨骼卷积神经网络框架输入多个不同的尺度,进而可以获取不同尺度的表示。提出的注视模型将分别处理不同尺度的特征并集成它们。然后,该模型的位置注视分支学习到每个像素位置上的多尺度特征的软加权。此外,我们添加了一个重新校准分支,与位置注视分支平行,用于重新校准每个类别的分数图。在 PASCAL VOC 2012 和 ADE20K 数据集上,我们取得了相当有竞争力的结果,超过了基线和相关工作。
Jul, 2018