重新思考空洞卷积在语义图像分割中的应用
本文提出了一种利用 Deep Learning 完成语义图像分割的方法,通过引入 atrous convolution 以及 atrous spatial pyramid pooling 来解决对象掩模问题,并结合 max-pooling 和 downsampling 与全连接条件随机场(CRF)来提高对象边界的定位准确性,在 PASCAL VOC-2012 等数据集上全面超越了以往的成果。
Jun, 2016
为了获得最佳的可变倍数空洞率,本研究提出了基于输入图像尺寸的实用指南,并对深度神经网络 DeepLab 中的分割模块进行了内部行为分析,发现使用最佳的可变倍数空洞率能够持续提高分割结果。
Jul, 2023
在语义分割任务中,采用空洞卷积作为增加感受野的方法,本研究通过在模型浅层引入大核心空洞卷积以及预训练图像编码器等策略,提出了 DSNet,一种新的双分支卷积神经网络结构,它在 ADE20K、Cityscapes 和 BDD 数据集上以更高的准确率和速度获得了最新的表现。
Jun, 2024
本文介绍了一种深度学习模型 DeepLabv3+,将网络的编码器和解码器模块相结合,采用空洞空间金字塔池化和深度可分离卷积技术,用于语义分割任务,实验表明该模型取得 89.0% 和 82.1% 的测试集性能,且附有 TensorFlow 参考实现。
Feb, 2018
本文提出了一种使用多尺度特征融合网络和 BiFPN 来进行实时图像语义分割的方法 ESeg,通过扩展传统的多尺度特征空间来实现,不需要高分辨率和昂贵的空洞卷积。实验证明,ESeg 在多个数据集上的表现比先前的方法更准确,并且实时性能得到提升。
Mar, 2022
本文提出了一种特别为密集预测设计的新的卷积网络模块,该模块利用扩张卷积系统地汇集多尺度上下文信息,而不会丢失分辨率,并证明了该模块可以提高现有最先进的语义分割系统的精度。同时,作者还探究了将图像分类网络适应于密集预测的可能性,并提出了简化适应后的网络结构有助于提高精度。
Nov, 2015
本文旨在解决在大型稀疏数据集上进行语义分割任务的挑战,提出了一种自适应采样方法和基于深度双通道卷积神经网络的算法,取得了 VISCERAL 解剖学基准测试的最新的最好结果。
Sep, 2017
通过引入 Vortex Pooling 方法,本文提出了一种有效而高效的语义分割方法,该方法在 PASCAL VOC 2012 中超越了现有的最先进模型 DeepLab v3,并且具有与 DeepLab v3 相似的计算代价。
Apr, 2018
本研究提出自适应对焦卷积层用于语义分割,通过并行合并多个不同膨胀率的卷积层及注意力机制,该卷积层可以根据处理后的上下文自适应地改变有效感受野的大小,提高网络的多尺度处理能力和特征提取能力,且可以轻松地集成到已有的网络中。我们在盆腔 CT 和脑部 MRI 分割等具有挑战性的任务上评估了该方法,获得了非常有希望的性能表现。
May, 2018
本研究设计了一种双并行、使用不同扩张率的卷积层的 ResNeXt,以提高区域感知率和保留局部细节,进而实现语义分割,并在实时 Cityscapes 和 CamVid 数据集上取得迄今最优成果。
Nov, 2021