超越语义图像分割:探索视频中高效推理的方法
本研究探讨了基于 CRF 推理在图像级别的语义分割之外,在视频帧中进行联合推理的效率,并结合语义共同标注和更具表现力的模型。在 CamVid 数据集上,通过 TextonBoost unaries,我们的提议方法在没有额外时间开销的情况下,相对于单独的语义图像分割,实现了高达 8% 的精度提升。
Sep, 2015
本文提出了一种结构化预测技术,其将高斯条件随机场与深度学习相结合,能够在保证唯一全局最优解的同时,使用精简的闭式表达式计算模型参数的梯度。通过在语义分割任务中引入多分辨率结构化优化框架,该系统在 PASCAL 2012 图像分割基准上显示出明显的改进。
Mar, 2016
该论文介绍了如何在全连接 CRFs 中添加条件独立假设,从而利用卷积重构推理,提高了推理和训练的速度,并可以通过反向传播轻松优化卷积 CRFs 的所有参数,以便于后续的 CRF 研究。
May, 2018
本研究提出了一种名为 VideoGCRF 的方法,采用深度高斯条件随机场对密集连接的时空图进行精确和高效的推断,能够与现代深度网络一起进行端到端的视频理解训练,并在语义分割和实例分割的任务中呈现出实证上的优越性。
Jul, 2018
本文提出了一种基于高斯核线性组合的高效近似推理算法,用于在完整的像素集上定义的全连接 CRF 模型的密集像素级连接,为多类图像分割和标注技术提供了显著的改进。
Oct, 2012
通过开发新的推理和学习框架,挑战当前视觉社区流行的基于高斯势函数的条件随机场模型,该框架可以通过梯度下降来学习成对的条件随机场势函数,可以考虑标准的空间和高维双边核,可用于深度神经网络中端到端地训练以提高语义分割的准确性。
Jan, 2017
本文提出了一种有效的语义视频分割方法,借鉴于现有方法中将结果传播到相邻帧或使用其他帧提取帧表示时可能会导致不准确的结果或不平衡的延迟问题,我们在推理过程中采用逐帧方式处理,其中显式考虑帧与帧之间的时间一致性,并将此一致性嵌入到语义分割网络中。通过新的知识蒸馏方法,我们成功地缩小了紧凑型模型与大型模型之间的性能差距。我们的结果在 Cityscapes 和 Camvid 等流行基准测试中优于先前的基于关键帧的方法,并提高了与独立训练每帧的对应基线的时间一致性。
Feb, 2020
本文主要介绍了一种基于预训练的 CNN 和 CRF 的图像分割方法,通过构建一些潜在的超像素来生成 CRF 的 potentials,并借助结构化 SVM 来学习 CRF 参数。研究者们还构建了空间相关的、共现的二元 potentials,以更加准确地描述目标物体在一定空间布局下的标签关系。实验表明,该方法在很多二元和多元分割测试中表现出很好的性能。
Mar, 2015
本文提出一种名为后验概率 CRF 的全新的端到端训练方法,该方法将 3D 全连接 CRF 应用于 CNN 的后验概率中,并一起优化 CNN 和 CRF,实验结果表明我们的方法在白质高信号区分割上表现优于 CNN,后处理 CRF 和不同的端到端训练 CRF 方法。
Nov, 2018
本文提出了一种基于 CNN 语义分割和 CRF 模型的三维实时地图生成系统,用于精确和大规模的图像语义建模,并在 KITTI 数据集上进行了验证并取得了 10% 的分割准确率提升。
Jul, 2017