LiteSeg:一种新型轻量级卷积神经网络用于语义分割
本文提出了一种轻量级的语义分割模型 PP-LiteSeg,其中包括一个灵活和轻量级的解码器(FLD),一个统一的注意力融合模块(UAFM)和一个简单的金字塔池化模块(SPPM),通过减少计算开销和融合输入特征来加强特征表示,结果表明 PP-LiteSeg 在准确性和速度之间取得了卓越的折衷。
Apr, 2022
本文提出了一种用于驾驶区域和车道线分割的轻量级模型 ——TwinLiteNet,该模型设计成低成本但能够达到准确和高效的分割结果。我们在 BDD100K 数据集上评估了 TwinLiteNet,并与现代模型进行了比较。实验结果表明,TwinLiteNet 与现有方法表现相似,但需要更少的计算资源。尤其是对于可行驶区域任务,TwinLiteNet 的 mIoU 得分为 91.3%,车道检测任务的 IoU 为 31.08%,仅使用了 40 万个参数,在 GPU RTX A5000 上实现了 415FPS。此外,TwinLiteNet 可以在计算能力有限的嵌入式设备上实时运行,特别是在 Jetson Xavier NX 上可以达到 60FPS,使其成为自动驾驶车辆的理想解决方案。
Jul, 2023
TwinLiteNetPlus 是一种旨在平衡效率和准确性的模型,通过使用标准和深度可分离扩张卷积来降低计算复杂性并保持高准确性,在解决自动驾驶中关键的语义分割问题(如行车区域分割和车道分割)方面展现出优秀的性能,同时在计算成本方面显著优于现有模型。
Mar, 2024
本文介绍一种名为 LEDNet 的轻量级网络,采用了不对称的编码器 - 解码器架构和 ResNet 作为骨干网络,以及每个残差块中的两种新操作:通道分割和随机洗牌。在解码器中采用注意金字塔网络 (APN) 来进一步减轻整个网络的复杂性。实验证明,我们的模型在速度和准确性方面均取得了最好的结果,并在 CityScapes 数据集上实现了最先进的结果。
May, 2019
本文介绍了一种用于语义像素分割的深度全卷积神经网络,称为 SegNet。该网络架构由编码器网络、相应的解码器网络和像素分类层组成,编码器网络的拓扑结构与 VGG16 网络的 13 个卷积层完全相同,解码器使用池化索引计算非线性上采样,使得解码器可以将低分辨率的特征映射映射到全分辨率的特征映射,从而在像素级别进行分类。评估结果表明,SegNet 相对于其他现有的架构具有更好的推理性能和更高的效率。
Nov, 2015
提出 SegNet,一种用于语义像素级图像标注的深度编码器 - 解码器结构。该网络通过编码器捕捉图像特征,并使用解码器映射到原始图像尺寸,实现了准确的像素级预测。在无需额外辅助信息的情况下,在几个公共基准数据集上的表现均优于最先进的方法。
May, 2015
本文提出了一种在语义分割任务中具有高计算效率的方法,基于完全卷积神经网络,在同时实现高平均交并比的情况下,可以在移动设备上实时运行。
Feb, 2019
本文提出了一个轻量级 LRNNet 模型,实现了高效的实时语义分割问题,通过降低计算成本和内存占用的非局部模块实现了更准确的非局部特征融合。实验证明,在训练时只使用精细注释数据的情况下,LRNNet 在 Cityscapes 测试数据集上达到了 72.2% 的 mIoU,并具有更好的轻量级,速度,计算和精度之间的平衡。
Jun, 2020
我们提出了 ShuffleSeg,这是一种基于分组卷积和通道混洗的有效分割网络,它采用 Skip 架构作为解码方法,在速度和准确性之间达到了最佳的折中,通过利用分辨率更高的特征图进行更准确的分割,它在 CityScapes 测试集上的平均交集联合达到了 58.3%,并且在 NVIDIA Jetson TX2 上的运行帧率为 15.7,非常适合实时应用。
Mar, 2018
本文考虑了有效和高效的语义图像分割问题,将一种强大的语义分割结构 RefineNet 适应为更紧凑的结构,通过减少参数数量和浮点操作数量,实现了两倍以上的模型缩小,并保持了性能水平,使最快模型的速度从 20 FPS 提高到 55 FPS,并在 PASCAL VOC 测试集上具有坚实的 81.1%的平均 iou 性能;我们还展示了我们的方法与轻量级分类网络的容易集成能力,并仅使用 3.3M 参数和 9.3B 浮点操作完成 PASCAL VOC 的 79.2%均值 iou。
Oct, 2018