学习密集卷积嵌入用于语义分割
该研究证明,卷积网络可以通过端到端的训练,从像素到像素地训练,超越先前的语义分割最先进方法,通过自适应大小输入和高效学习来生成相应大小的输出。该研究还详细介绍了全卷积网络的应用于空间密集预测任务,并将 AlexNet、VGG 网和 GoogLeNet 等现代分类网络改进成全卷积网络,并将它们学习到的表示通过微调应用于语义分割任务。最后,该研究提出了一种新的网络架构,将深层次粗糙层和浅层外观信息相结合以生成准确和详细的分割结果,在 PASCAL VOC、NYUDv2 和 SIFT Flow 数据集上实现了最先进的语义分割(2012年的mean IU相较前一方法提高20%),对典型图像的推理时间仅需三分之一秒。
Nov, 2014
该研究论文结合深度卷积神经网络和概率图模型的方法来解决像素级分类(语义图像分割)任务中深层网络往往无法精确定位目标分割的问题,并通过将深层网络的响应与全连接条件随机场相结合,提出了一种 DeepLab 系统。定量实验表明,该方法在 PASCAL VOC-2012 语义图像分割任务中,IOU 精度可达 71.6%。
Dec, 2014
作者提出一种针对弱监督和半监督学习条件下的语义图像分割模型训练的Expectation-Maximization方法,实验表明所提技术具有竞争性的成果,同时需求更少的标注工作量。
Feb, 2015
本论文研究了怎样在卷积神经网络中实现多尺度特征表示,提出了一种注重对每个像素位置进行加权的注意力机制。通过对三个大型数据集的广泛实验,证明了该方法的有效性。
Nov, 2015
本文提出了一种基于卷积神经网络的Fully Convolutional Networks(FCN)方法,可以用于图像的深度语义分割。通过该方法,我们成功地提高了 PASCAL VOC、NYUDv2、SIFT Flow 和 PASCAL-Context 等公开数据集上的 segmentation 模型的性能,并且推断速度远快于之前的相关工作。
May, 2016
本文提出了一种利用Deep Learning完成语义图像分割的方法,通过引入atrous convolution以及atrous spatial pyramid pooling来解决对象掩模问题,并结合max-pooling和downsampling与全连接条件随机场(CRF)来提高对象边界的定位准确性,在PASCAL VOC-2012等数据集上全面超越了以往的成果。
Jun, 2016
通过结合语义分割和语义感知边缘检测,将类边界显式地融入模型,有效地解决了深网络在学习上下文信息时对高频细节的模糊化问题,从而显著地提高了基于卷积神经网络的语义分割准确度,该方法也在ISPRS Vaihingen基准测试中取得了超过90%的总体准确率。
Dec, 2016
该研究提出了一种利用卷积神经网络(CNN)中的分割信息的方法,通过设置CNN来提供嵌入空间来获取分割信息,以便在局部感受野范围内使每个神经元可以选择性地关注来自其本身区域的输入,因此适应于局部分割提示,在两个密集预测任务中展示了性能优于进行过增强的基线的结果。
Aug, 2017
本文针对自主行驶场景下的语义分割问题进行了调研,从模型开发、RGB-D数据集集成、时域信息模型三个方面讨论了目前最相关和最新的深度学习方法,旨在为读者提供关于这一激动人心和具有挑战性的研究领域的最新进展。
Mar, 2023