重新思考 BiSeNet 实时语义分割
本文提出了一种名为 Bilateral Segmentation Network(BiSeNet)的新型网络结构,通过引入 Spatial Path、Context Path 以及 Feature Fusion Module 三个模块,实现了在保持高分辨率的同时增加感受野,达到了在 Cityscapes、CamVid 和 COCO-Stuff 数据集上速度和分割性能相对平衡的效果,对于 2048x1024 的输入,我们在 Cityscapes 测试数据集上实现了 68.4%的平均 IOU,在 NVIDIA Titan XP 卡上的速度为 105 FPS,比现有方法更快,同时性能相当。
Aug, 2018
该研究提出了一种名为 Bilateral Segmentation Network (BiSeNet V2) 的神经网络架构,通过将空间细节和分类语义分别处理来实现高效准确的实时语义分割,并使用 Detailed Branch 和 Semantic Branch 来分别处理低级和高级特征。
Apr, 2020
本文介绍了一种快速分割卷积神经网络(Fast-SCNN),它是一种高分辨率图像数据(1024x2048px)的半实时语义分割模型,适用于在低内存嵌入式设备上进行高效计算。该网络通过在多个分辨率分支上同时计算低级特征和高级特征,实现了高分辨率的空间细节与更低分辨率下提取的深度特征的结合,并在 Cityscapes 数据集上以每秒 123.5 帧的速度获得了 68.0%的平均交并比准确率。实验证明,预先培训规模的大规模预处理是不必要的。
Feb, 2019
本文提出了一种用于城市街景的语义分割的高性能深卷积神经网络方法,它实现了精度和速度之间的良好权衡,并展示了在实时速度下使用单个 NVIDIA TITAN X 卡片在具有挑战性的 Cityscapes 和 CamVid 测试数据集上分别实现了 73.6%和 68.0%的 mIoU 精度。
Mar, 2020
提出了一种针对图像分割的高效多任务架构 BiSeNetFormer,能够在保持高效和准确性的同时处理多种分割任务,其结果表明 BiSeNetFormer 在模型效率和任务适应性之间构建了桥梁,具有快速、高效和多任务分割网络的显著进展。
Apr, 2024
该研究提出了一种名为 TDNet 的时态分布网络,旨在实现快速准确的视频语义分割,该网络使用深度卷积神经网络从视频中提取特征,并通过逐帧分布的方式,引入了新颖的注意力传播模块和分组知识蒸馏损失函数,从而达到了较高的分割准确率和更低的延迟。
Apr, 2020
本文提出了一种基于图像级联网络 (ICNet) 的实时语义分割方法,通过多分辨率分支和级联特征融合单元,以及恰当的标签引导来降低像素级标签推断的计算量,从而实现对挑战性数据集(如 Cityscapes,CamVid 和 COCO-Stuff)的高质量实时分割。
Apr, 2017
自动驾驶汽车的语义分割是理解周围环境的关键技术。研究通过融合编码器 - 解码器和两通道架构,提出了空间助理编码器 - 解码器网络(SANet),并在设计中利用不同分辨率的特征提取和池化模块以优化特征提取和实现语义提取,最终在实时 CamVid 和 Cityscape 数据集上达到竞争性的结果。
Sep, 2023
该研究提出了一种基于数据增强的网络和训练策略,用于更有效地利用可用的标注样本,以实现对神经结构的分割和细胞跟踪。研究表明,这种网络可以从极少量的图像中进行端对端的训练,并在电子显微图像和透射光显微图像上均取得了优异的分割和跟踪效果,且速度快。
May, 2015
本文提出了一种高效的语义图像分割架构,使用深度空间(D2S)操作来消除传统编码器 - 解码器分割模型的解码器部分,减少计算量,相较于标准分割模型在路面分割数据集上表现可比、计算成本更低。
May, 2018