深度估计和语义分割的混合网络
该研究论文结合深度卷积神经网络和概率图模型的方法来解决像素级分类(语义图像分割)任务中深层网络往往无法精确定位目标分割的问题,并通过将深层网络的响应与全连接条件随机场相结合,提出了一种 DeepLab 系统。定量实验表明,该方法在 PASCAL VOC-2012 语义图像分割任务中,IOU 精度可达 71.6%。
Dec, 2014
本文提出了基于像素 embeddings 的深层卷积神经网络,利用嵌入学习像素之间的距离来推断像素是否属于同一区域,并证明其与 DCNN 结合使用可以显著提高每个像素分类的准确性。
Nov, 2015
本研究采用多尺度卷积神经网络,提出一种单一RGB图像用于深度估计和语义分割的深度学习模型,该模型采用单一损失函数进行训练,同时使用完全连接的CRF捕捉语义和深度线索之间的上下文关系和交互作用,实现更精确的结果。在NYUDepth V2数据集上进行实验,该模型在语义分割方面表现优于最先进方法,在深度估计任务上实现可比较的结果。
Apr, 2016
该论文综述了应用于各种应用领域的基于深度学习技术的图像语义分割方法,描述了该领域的术语和必要的背景概念,并评估了现有方法的贡献和意义,并给出了相应的定量结果和讨论。
Apr, 2017
利用深度学习模型在机器人中作为感知信息提取器的部署,有许多困难之处。本文着重探讨了其中三个最显著的障碍,即如何将单个模型适应于同时执行多个任务的需求、如何实现实时性、以及如何使用具有不对等标注数量的非对称数据集。通过使用实时语义分割网络和知识蒸馏的简单解决方案,我们将这些障碍一一克服。最终,我们的系统可以方便地扩展,使用单个模型同时处理更多任务和未来更多的数据集,能够在室内和室外分别执行深度估计和分割,并在640x480像素的输入上只需要一个前向通道即可实现13ms和6.5 GFLOPs成本的效果,从而直接将其用于场景的3D语义重建中。
Sep, 2018
本文提出了一种在语义分割任务中具有高计算效率的方法,基于完全卷积神经网络,在同时实现高平均交并比的情况下,可以在移动设备上实时运行。
Feb, 2019
论文提出了一种同时预测深度估计和语义分割输出的CNN模型,通过对单目输入图像进行实验,我们证明了该模型对于场景理解和深度估计能力达到了最新的研究水平。
Jul, 2019
通过引入语义物体性概念分析成像过程,本文提出了一种基于物体性假设的语义物体分割和深度估计网络(SOSD-Net),并采用期望最大化算法的迭代思想更有效地训练该网络,实验结果表明该方法具有卓越的性能。
Jan, 2021
本文提出了一种基于HRNet网络的深度估计网络——DIFFNet,它能在下采样和上采样过程中利用语义信息,并通过特征融合和注意力机制提高算法表现,实验结果表明,该方法在KITTI基准数据集上优于当前最先进的单目深度估计方法,并具有处理更高分辨率数据的潜力。我们还通过建立具有挑战性案例的测试集提出了额外的评估策略。
Oct, 2021
本文针对自主行驶场景下的语义分割问题进行了调研,从模型开发、RGB-D数据集集成、时域信息模型三个方面讨论了目前最相关和最新的深度学习方法,旨在为读者提供关于这一激动人心和具有挑战性的研究领域的最新进展。
Mar, 2023