全卷积神经网络用于语义分割
该研究证明,卷积网络可以通过端到端的训练,从像素到像素地训练,超越先前的语义分割最先进方法,通过自适应大小输入和高效学习来生成相应大小的输出。该研究还详细介绍了全卷积网络的应用于空间密集预测任务,并将 AlexNet、VGG 网和 GoogLeNet 等现代分类网络改进成全卷积网络,并将它们学习到的表示通过微调应用于语义分割任务。最后,该研究提出了一种新的网络架构,将深层次粗糙层和浅层外观信息相结合以生成准确和详细的分割结果,在 PASCAL VOC、NYUDv2 和 SIFT Flow 数据集上实现了最先进的语义分割(2012年的mean IU相较前一方法提高20%),对典型图像的推理时间仅需三分之一秒。
Nov, 2014
该研究论文结合深度卷积神经网络和概率图模型的方法来解决像素级分类(语义图像分割)任务中深层网络往往无法精确定位目标分割的问题,并通过将深层网络的响应与全连接条件随机场相结合,提出了一种 DeepLab 系统。定量实验表明,该方法在 PASCAL VOC-2012 语义图像分割任务中,IOU 精度可达 71.6%。
Dec, 2014
本文提出一种基于学习反卷积网络的新颖语义分割算法,其中反卷积网络由反卷积层和上采样层组成,能够在像素级别上识别图像中的类别标签和预测分割掩模,通过将结果合并得到最终的分割图像,并且可以自然地处理多尺度下的物体和识别细节结构,在PASCAL VOC 2012数据集上进行实验,通过与完全卷积网络的集合学习,取得了最好的72.5%精度。
May, 2015
本文提出了基于像素 embeddings 的深层卷积神经网络,利用嵌入学习像素之间的距离来推断像素是否属于同一区域,并证明其与 DCNN 结合使用可以显著提高每个像素分类的准确性。
Nov, 2015
本文提出了一种利用Deep Learning完成语义图像分割的方法,通过引入atrous convolution以及atrous spatial pyramid pooling来解决对象掩模问题,并结合max-pooling和downsampling与全连接条件随机场(CRF)来提高对象边界的定位准确性,在PASCAL VOC-2012等数据集上全面超越了以往的成果。
Jun, 2016
本文提出了一种基于Densely Connected Convolutional Networks的语义分割方法,不需要进一步的后处理模块或预训练即可在CamVid和Gatech等城市场景基准数据集上达到最先进的结果。此外,由于模型的智能构造,我们的方法在参数数量方面比当前已发布的最佳结果少得多。
Nov, 2016
该研究提出了一种利用卷积神经网络(CNN)中的分割信息的方法,通过设置CNN来提供嵌入空间来获取分割信息,以便在局部感受野范围内使每个神经元可以选择性地关注来自其本身区域的输入,因此适应于局部分割提示,在两个密集预测任务中展示了性能优于进行过增强的基线的结果。
Aug, 2017
通过利用扩张卷积等方法,本文提出一种弱监督下语义分割的新模型,能够得到准确的物体分割结果,相较于之前的方法在具有1,464个分割掩码的半监督和仅有图像级标签的弱监督设置下,分别获得了60.8%和67.6%的高精度分割效果,成为当前最优秀的模型。
May, 2018