使用深度密集连接 MRF 的自动驾驶实例级分割
本文进行了实例感知语义分割的研究,提出了一种利用全卷积网络的方法预测语义标签、深度和基于实例的编码,并通过低层次计算机视觉技术在 KITTI 和 Cityscapes 街景数据集上生成最先进的实例分割,该方法在性能上超过了现有的工作,并可以额外预测单个实例与单眼图像的绝对距离以及像素级语义标签。
Apr, 2016
本论文提出了一种名为 Deep Parsing Network (DPN) 的卷积神经网络,通过将高阶关系和标签上下文的混合引入到 MRF 模型中,该网络能够在一次前向传递中实现确定性的端到端计算。与先前使用迭代算法优化 MRF 不同的是,该论文通过 DPN 精确求解 MRF,并能够在近似一次 MF 迭代的情况下达到较高的分割精度。此外,DPN 使得 MF 更容易被并行化和加速,从而可以实现高效的推理。
Jun, 2016
本文针对从单目图像进行实例级别分割和深度排序的问题,利用卷积神经网络训练来直接预测实例级别分割,同时采用马尔科夫随机场来提供图像的连贯单个解释,旨在预测准确的实例级别分割和深度排序,并在 KITTI 基准测试中表现出很好的性能。
May, 2015
本文提出了一种基于全连接神经元的新型 MRF 模型,将深度神经网络的表达能力和 MRF 的循环依赖结构结合在了一起,通过对多个 RNN 进行逆向连接形成的前馈网络的近似表示,实现了高效的学习和在各种低级视觉任务中的卓越表现。
Sep, 2016
该研究论文通过将高阶关系和标签上下文混合等丰富信息融入到马尔可夫随机场中,提出了一种名为深度解析网络的卷积神经网络,通过一次前向运算实现确定性的端到端计算。在 PASCAL VOC 2012 数据集上经过全面评估,表现出卓越的分割准确性。
Sep, 2015
基于深度学习的神经 MRF 模型在立体匹配任务中取得了显著的性能提升,通过在潜在函数和信息传递方面应用数据驱动的神经网络,该模型有效地解决了传统立体方法中的建模限制和精度问题,并借助变分推断理论保留了立体 MRF 模型的图感知特征。对于高分辨率图像进行可行的推理,并通过适应性地剪枝视差搜索空间的 Disparity Proposal Network (DPN),使得该方法在 KITTI 2012 和 2015 榜单上名列第一,且运行时间不超过 100 毫秒。与传统的全局方法相比,本方法的性能显著提升,例如在 KITTI 2015 数据集上将 D1 指标降低了 50%,并且具有强大的跨领域泛化能力和恢复锐利边缘的特点。详细代码请参见此链接。
Mar, 2024
本文介绍了一种新颖的倾斜平面 MRF 模型,它同时对遮挡边界和深度进行推理。作者将问题定义为混合 MRF 中的推理问题,其中包括连续(即倾斜的 3D 平面)和离散(即遮挡边界)随机变量,从而使他们能够定义潜在函数,编码由分割边界组成的像素的所有权,以及编码哪些交界处是物理上可能的。我们的方法在 Middlebury 高分辨率图像以及更具挑战性的 KITTI 数据集上表现优于现有的倾斜平面 MRF 方法,并且比现有的方法更高效,平均需要 2 分钟来执行高分辨率图像的推理。
Apr, 2012
提出了一种多任务学习策略来解决三维实体标记问题,该方法可以 accurately separate 连通的和扫描不完整的对象,实验表明该方法在 ScanNet 数据集上实现了最先进的性能。
Jun, 2019
本研究介绍了一种新的学习目标,用于训练深度神经网络执行端对端的图像像素聚类,该方法已应用于实例分割,其结果是出色的,并且在 2017 CVPR 自动驾驶挑战的车道检测竞赛中获得第二名,而在不使用外部数据的情况下是最优表现者。
Mar, 2018
该论文介绍了一种解决视频对象分割问题的新型空间 - 时间马尔可夫随机场(MRF)模型,该模型通过卷积神经网络(CNN)编码像素之间的空间依赖关系,并利用光流建立时间依赖关系来结合空间和时间线索,提出了一种嵌入 CNN 的算法,以实现近似的 MRF 推理。
Mar, 2018