- 金字塔玛巴:基于选择性空间状态模型重新思考金字塔特征融合用于遥感图像语义分割
基于深度学习和多尺度特征融合的 PyramidMamba 语义分割网络在多个公开数据集上取得了最先进的性能,并展示了实时语义分割的巨大潜力。
- 实时语义分割多目标优化基准测试套件
自动机器学习中的硬件感知神经架构搜索(HW-NAS)任务可视为黑盒多目标优化问题,其中一个重要应用是实时语义分割,通过一项新的基准测试套件 CitySeg/MOP 将 HW-NAS 任务转化为标准多目标优化问题,并在多种多目标进化算法上全面 - 多层特征聚合与递归对齐网络在实时语义分割中的应用
通过引入多级特征聚合和递归对齐网络 (MFARANet),在实时推理速度下实现高分割准确度;利用 ResNet-18 作为骨干网络并提出三个核心组件来弥补由于骨干网络较浅导致的模型容量不足;在三个基准数据集上进行了综合实验,结果表明我们的方 - AAAISCTNet:用于实时分割的单分支 CNN 与 Transformer 语义信息
SCTNet 是一种采用变换器语义信息的单分支卷积神经网络,用于实时分割任务,并在 Cityscapes、ADE20K 和 COCO-Stuff-10K 数据集上展现出最新的最先进性能。
- 实时语义分割:遥感中的简要调查与比较研究
远程感知影像的实时语义分割是一个具有挑战性的任务,需要在效果和效率之间进行权衡。本论文总结了设计高效深度神经网络的基本压缩方法,并对远程感知影像的实时语义分割的最新发展进行了简要而全面的调查。实验结果表明,现有的大多数高效深度神经网络都具有 - Cross-CBAM:用于场景分割的轻量级网络
本文提出了用于实时语义分割的轻量级网络 Cross-CBAM,其中包括 SE-ASPP 和 CCBAM 等创新模块,使用注意力机制来聚焦所需信息并进行特征融合,实验结果表明 Cross-CBAM 在保证分割准确度的同时具有较快的推理速度。
- JetSeg:用于低功耗 GPU 嵌入式系统的高效实时语义分割模型
我们提出了一种用于实时语义分割的高效模型,称为 JetSeg,包括一个名为 JetNet 的编码器和一个改进的 RegSeg 解码器,JetNet 针对 GPU 嵌入式系统设计,包括 JetBlock 和 JetConv 两个主要组件以及 - DWRSeg:一种用于实时语义分割的扩张 - 残差网络
提出了一个名为 Dilation-wise Residual segmentation (DWRSeg) 的有效且高效的结构,含有不同的感受野尺寸,可用于实时语义分割任务,城市景观和 CamVid 数据集上实验证明了该方法的有效性和轻便性能 - PIDNet:基于 PID 控制器的实时语义分割网络
本文提出了一种三支路网络体系结构 PIDNet,能够解决两支路网络体系结构中详细和语境特征混淆的问题,并利用边界关注技术在最终阶段对详细和语境支路进行融合,极大地提高了精度和神经网络处理速度。
- 标签传播与细化的高效视频语义分割
本文提出了一种高清视频实时语义分割的混合 GPU / CPU 方法,并给出了一种称之为 EVS 的管道,该管道结合了 CPU 和 GPU 两种不同的处理方式,以优化视频帧率和分割准确度。
- 基于空间融合网络的实时语义分割
本文提出了一种高效的 CNN 方法 ——MSFNet,它利用类边界监督和多特征融合模块来实现实时语义分割,并在 Cityscapes 和 Camvid 数据集上得到了比现有方法更好的结果。
- MAVNet:面向 MAV 任务的有效语义分割微型网络
本研究提出了一个小型、轻量级的深度神经网络 MAVNet,用于实时语义分割图像,可用于空中监视和检查任务,并提出了两个新颖的数据集来验证算法,并实现了离线和在线实验。
- 实时语义分割的背景减除
本文提出了一种基于实时语义分割的新型背景减除定义,其由传统的背景分割器和实时语义分割器组成,并在 CDnet 数据集上评估,达到了同类无监督背景减除方法的最优表现,甚至优于某些基于深度学习的有监督算法,并且具有潜在的泛化能力。
- MM用于实时语义分割的高效非对称卷积密集模块
本文提出一种卷积神经网络结构,命名为 Efficient Dense modules with Asymmetric convolution (EDANet),它采用不对称卷积结构和膨胀卷积和稠密连接并具有低计算成本和模型大小,比现有的快速 - ShuffleSeg:实时语义分割网络
我们提出了 ShuffleSeg,这是一种基于分组卷积和通道混洗的有效分割网络,它采用 Skip 架构作为解码方法,在速度和准确性之间达到了最佳的折中,通过利用分辨率更高的特征图进行更准确的分割,它在 CityScapes 测试集上的平均交 - ECCVICNet 用于高分辨率图像的实时语义分割
本文提出了一种基于图像级联网络 (ICNet) 的实时语义分割方法,通过多分辨率分支和级联特征融合单元,以及恰当的标签引导来降低像素级标签推断的计算量,从而实现对挑战性数据集(如 Cityscapes,CamVid 和 COCO-Stuff