Keras 中的图像分割:Segnet、FCN、UNet、PSPNet 和其他模型的实现
本文介绍了一种用于语义像素分割的深度全卷积神经网络,称为 SegNet。该网络架构由编码器网络、相应的解码器网络和像素分类层组成,编码器网络的拓扑结构与 VGG16 网络的 13 个卷积层完全相同,解码器使用池化索引计算非线性上采样,使得解码器可以将低分辨率的特征映射映射到全分辨率的特征映射,从而在像素级别进行分类。评估结果表明,SegNet 相对于其他现有的架构具有更好的推理性能和更高的效率。
Nov, 2015
该研究证明,卷积网络可以通过端到端的训练,从像素到像素地训练,超越先前的语义分割最先进方法,通过自适应大小输入和高效学习来生成相应大小的输出。该研究还详细介绍了全卷积网络的应用于空间密集预测任务,并将 AlexNet、VGG 网和 GoogLeNet 等现代分类网络改进成全卷积网络,并将它们学习到的表示通过微调应用于语义分割任务。最后,该研究提出了一种新的网络架构,将深层次粗糙层和浅层外观信息相结合以生成准确和详细的分割结果,在 PASCAL VOC、NYUDv2 和 SIFT Flow 数据集上实现了最先进的语义分割(2012 年的 mean IU 相较前一方法提高 20%),对典型图像的推理时间仅需三分之一秒。
Nov, 2014
本文提出了一种基于卷积神经网络的 Fully Convolutional Networks(FCN)方法,可以用于图像的深度语义分割。通过该方法,我们成功地提高了 PASCAL VOC、NYUDv2、SIFT Flow 和 PASCAL-Context 等公开数据集上的 segmentation 模型的性能,并且推断速度远快于之前的相关工作。
May, 2016
本文提出一种针对 Pascal VOC 数据集的语义分割方法,通过使用 FCN、数据增强、类别不平衡权重和迁移学习等方法,以及 U-Net 和 ResNet 等不同的神经网络架构,有效地提高了模型的像素精度和 IoU 性能。研究表明数据增强是最有贡献的改进方法,而迁移学习模型在 Pascal 数据集上表现最佳。
Apr, 2023
提出 SegNet,一种用于语义像素级图像标注的深度编码器 - 解码器结构。该网络通过编码器捕捉图像特征,并使用解码器映射到原始图像尺寸,实现了准确的像素级预测。在无需额外辅助信息的情况下,在几个公共基准数据集上的表现均优于最先进的方法。
May, 2015
本文综述了基于深度卷积神经网络的语义分割、实例分割、全景分割模型的发展历程、架构细节、超参数调整和性能表现,并对不同数据集上的性能进行了比较。
Jan, 2020
研究在稀缺数据的支持下,将少样本学习方法拓展到密集语义图像分割中,通过训练网络,产生 Fully Convolutional Network 参数来执行稀缺数据学习。与 PASCAL VOC 2012 数据集中最佳基线方法相比,我们的架构在新语义类的单次分段中展示了相对 25% 的 meanIoU 改进,并且速度至少快 3 倍。
Sep, 2017