PaddleSeg: 图像分割高效开发工具包
本文综述了关于图像分割的研究,特别关注了基于深度学习模型的语义分割和实例分割方法,包括全卷积像素标定网络、编码器 - 解码器架构、多尺度与基于金字塔的方法、循环神经网络、视觉注意力模型和对抗生成模型。我们探讨了这些深度学习模型的相似性,能力和挑战,并讨论了未来的研究方向。
Jan, 2020
我们提出了一种用于实时语义分割的高效模型,称为 JetSeg,包括一个名为 JetNet 的编码器和一个改进的 RegSeg 解码器,JetNet 针对 GPU 嵌入式系统设计,包括 JetBlock 和 JetConv 两个主要组件以及 JetLoss 损失函数,实验结果表明,JetSeg 比现有的实时编码器 - 解码器模型更适合工作站设备和低功率 GPU 嵌入式系统,并且比其他模型快 2 倍。
May, 2023
本文介绍了一套用于语义分割的综合性库,包括 SegNet、FCN、UNet 和 PSPNet 等流行分割模型的实现。同时,我们还在多个数据集上评估和比较了这些模型,为研究人员和实践者提供了应对各种分割挑战的强大工具集。
Jul, 2023
本文提出了一种通用框架 FreeSeg,通过一次训练优化全一体网络,并采用相同的架构和参数在推理过程中无缝处理各种分割任务。此外,自适应提示学习有助于统一的模型捕捉任务感知和类别敏感概念,在多任务和各种场景中提高模型鲁棒性。大量实验结果表明,在三个分割任务上,FreeSeg 在性能和泛化方面建立了新的最先进结果,比最好的任务特定架构高出很大的幅度:在语义分割、实例分割和 COCO 上的全景分割中,未见类别的 PQ 分别达到 5.5%,17.6%和 20.1%。
Mar, 2023
本文提出了一个实时语义分割基准测试框架,包括特征提取和解码方法的分离设计,采用不同的网络架构和分割方法,在城市场景的 Cityscapes 数据集上进行了实验,并展示了与 SegNet 相比可实现 143 倍 GFLOPS 减少的优势。
Mar, 2018
研究介绍了一个简单而彻底评估的深度学习框架,应用于任意医学图像体的分割,同时不需要任务特定的信息和人为干预。该系统基于一个固定的模型拓扑和固定的超参数集,排除了模型选择的过程和方法级别的过拟合。此外,使用多平面数据增强,结合了一个基于常见 U-Net 的 2D 架构,让 2D 模型学习表示 3D 图像体的表示方法,从而提高了泛化性能。
Nov, 2019
我们提出了 ShuffleSeg,这是一种基于分组卷积和通道混洗的有效分割网络,它采用 Skip 架构作为解码方法,在速度和准确性之间达到了最佳的折中,通过利用分辨率更高的特征图进行更准确的分割,它在 CityScapes 测试集上的平均交集联合达到了 58.3%,并且在 NVIDIA Jetson TX2 上的运行帧率为 15.7,非常适合实时应用。
Mar, 2018
TinySeg 是一个优化模型的框架,可以在小型嵌入式系统中实现内存高效的图像分割,通过分析目标模型中张量的生命周期并识别长期存在的张量,利用张量溢出和合并提取技术将目标模型的峰值内存使用率降低了 39.3%。
May, 2024
这篇论文提出了 SSSegmentation,这是一个基于 PyTorch 的开源有监督语义图像分割工具箱,它基于 MMSegmentation 的设计,但由于更少的依赖因此更容易使用,在相似的训练和测试设置下实现了更优异的分割性能;此外,该工具箱还为流行和现代语义分割方法提供了大量的预训练权重,包括 Deeplab、PSPNet、OCRNet、MaskFormer 等等。
May, 2023