高效 FCN:用整体指导解码进行语义分割
针对语义分割中的计算效率和精度问题,本文提出一种知识蒸馏方法,利用预训练自编码器在转移潜空间内优化特征相似度,同时引入亲和力蒸馏模块以计算整个图像的远程依赖,将经典的深度 FCN 用于大步长下进行语义分割,实验证明,所提出的方法不仅可以提高小型 FCN 的精度,还可以使用较少的 FLOPS 训练出优秀的小型模型。
Mar, 2019
提出了一种基于多层浅层反卷积网络(SDN)的语义分割技术,通过多层网络集成上下文信息并加入层内和层间连接以提高特征融合和流向信息,应用层级监督优化网络训练,取得优异的分割效果。
Aug, 2017
该研究证明,卷积网络可以通过端到端的训练,从像素到像素地训练,超越先前的语义分割最先进方法,通过自适应大小输入和高效学习来生成相应大小的输出。该研究还详细介绍了全卷积网络的应用于空间密集预测任务,并将 AlexNet、VGG 网和 GoogLeNet 等现代分类网络改进成全卷积网络,并将它们学习到的表示通过微调应用于语义分割任务。最后,该研究提出了一种新的网络架构,将深层次粗糙层和浅层外观信息相结合以生成准确和详细的分割结果,在 PASCAL VOC、NYUDv2 和 SIFT Flow 数据集上实现了最先进的语义分割(2012 年的 mean IU 相较前一方法提高 20%),对典型图像的推理时间仅需三分之一秒。
Nov, 2014
本文提出了一种基于卷积神经网络的 Fully Convolutional Networks(FCN)方法,可以用于图像的深度语义分割。通过该方法,我们成功地提高了 PASCAL VOC、NYUDv2、SIFT Flow 和 PASCAL-Context 等公开数据集上的 segmentation 模型的性能,并且推断速度远快于之前的相关工作。
May, 2016
本文提出了一种 Context Encoding Module 方法,在原有 FCN 框架的基础上加入了全局场景语义信息来优化语义分割结果,在 PASCAL-Context、PASCAL VOC 2012 和 ADE20K 数据集上取得了最新最优的成果,并且通过在 CIFAR-10 数据集上进行对比实验表明该方法可以用来改善相对浅层网络的特征表示效果。
Mar, 2018
基于全卷积网络(FCN)的图形模型 Graph-FCN 用于图像语义分割,将图像网格数据扩展为图形结构数据,然后应用图形卷积网络解决图形节点分类问题,与原始 FCN 模型相比在 VOC 数据集上实现了竞争性的 mIOU 性能提升约 1.34%。
Jan, 2020
通过使用类 ResNet 的主干和小型多尺度头部的简单编码器 - 解码器架构,扩大有效接受域, 实现了与 HRNet 等复杂语义分割架构相当甚至更好的性能,提供了简单有效的基准模型供从业者开发高效的语义分割模型。
Jun, 2022
探讨了如何在图像识别的语义分割领域中,采用 ReNet 层代替全卷积神经网络中的级联卷积和池化层来使局部感受野具有全局信息,并开发了一种新的混合深层 ReNet(H-ReNet)模型,经实验证明其在 PASCAL VOC 2012 基准测试中的识别准确度比 Piecewise、CRFasRNN 和 DeepParsing 高 3.6%、2.3% 和 0.2%。
Mar, 2016
本文介绍了一种快速分割卷积神经网络(Fast-SCNN),它是一种高分辨率图像数据(1024x2048px)的半实时语义分割模型,适用于在低内存嵌入式设备上进行高效计算。该网络通过在多个分辨率分支上同时计算低级特征和高级特征,实现了高分辨率的空间细节与更低分辨率下提取的深度特征的结合,并在 Cityscapes 数据集上以每秒 123.5 帧的速度获得了 68.0%的平均交并比准确率。实验证明,预先培训规模的大规模预处理是不必要的。
Feb, 2019
提出了一种轻量级特征金字塔编码网络(FPENet)来在语义分割任务中平衡精度和速度。通过深度扩张卷积对多尺度上下文特征进行特征金字塔编码块的编码,在解码器中引入了互相嵌入上采样模块以高效聚合高级语义特征和低级空间细节。在 Cityscapes 和 CamVid 基准数据集上,该网络具有更少的参数和更高的推理速度,并实现了 68.0%的平均 IoU 和 102 FPS 的速度。
Sep, 2019