重新思考空洞卷积在语义图像分割中的应用

Jun, 2017

重新思考空洞卷积在语义图像分割中的应用

Rethinking Atrous Convolution for Semantic Image Segmentation

Liang-Chieh Chen, George Papandreou, Florian Schroff, Hartwig Adam

TL;DR本文旨在设计 DeepLabv3 系统进行语义图像分割，并通过引入多尺度上下文与全局信息，使用多种空洞卷积组合实现对多尺度物体的分割，最终在 PASCAL VOC 2012 语义图像分割基准测试中取得了令人满意的表现。

Abstract

In this work, we revisit atrous convolution, a powerful tool to explicitly adjust filter's field-of-view as well as control the resolution of feature responses computed by Deep Convolutional Neural Networks, in the application of →

atrous convolution semantic image segmentation multi-scale context deeplabv3 pascal voc 2012

发现论文，激发创造

DeepLab：通过深度卷积网络，空洞卷积和全连接 CRF 进行语义图像分割

本文提出了一种利用 Deep Learning 完成语义图像分割的方法，通过引入 atrous convolution 以及 atrous spatial pyramid pooling 来解决对象掩模问题，并结合 max-pooling 和 downsampling 与全连接条件随机场（CRF）来提高对象边界的定位准确性，在 PASCAL VOC-2012 等数据集上全面超越了以往的成果。

Jun, 2016

分辨率感知的用于语义分割网络的空洞率设计

为了获得最佳的可变倍数空洞率，本研究提出了基于输入图像尺寸的实用指南，并对深度神经网络 DeepLab 中的分割模块进行了内部行为分析，发现使用最佳的可变倍数空洞率能够持续提高分割结果。

Jul, 2023

DSNet：一种在语义分割中使用空洞卷积的新方法

在语义分割任务中，采用空洞卷积作为增加感受野的方法，本研究通过在模型浅层引入大核心空洞卷积以及预训练图像编码器等策略，提出了 DSNet，一种新的双分支卷积神经网络结构，它在 ADE20K、Cityscapes 和 BDD 数据集上以更高的准确率和速度获得了最新的表现。

Jun, 2024

采用空洞可分离卷积的编码器 - 解码器用于语义图像分割

本文介绍了一种深度学习模型 DeepLabv3+，将网络的编码器和解码器模块相结合，采用空洞空间金字塔池化和深度可分离卷积技术，用于语义分割任务，实验表明该模型取得 89.0% 和 82.1% 的测试集性能，且附有 TensorFlow 参考实现。

Feb, 2018

重访多尺度特征融合在语义分割中的应用

本文提出了一种使用多尺度特征融合网络和 BiFPN 来进行实时图像语义分割的方法 ESeg，通过扩展传统的多尺度特征空间来实现，不需要高分辨率和昂贵的空洞卷积。实验证明，ESeg 在多个数据集上的表现比先前的方法更准确，并且实时性能得到提升。

Mar, 2022

空洞卷积多尺度上下文聚合

本文提出了一种特别为密集预测设计的新的卷积网络模块，该模块利用扩张卷积系统地汇集多尺度上下文信息，而不会丢失分辨率，并证明了该模块可以提高现有最先进的语义分割系统的精度。同时，作者还探究了将图像分类网络适应于密集预测的可能性，并提出了简化适应后的网络结构有助于提高精度。

Nov, 2015

一种自适应采样方案，用于高效训练全卷积网络进行语义分割

本文旨在解决在大型稀疏数据集上进行语义分割任务的挑战，提出了一种自适应采样方法和基于深度双通道卷积神经网络的算法，取得了 VISCERAL 解剖学基准测试的最新的最好结果。

Sep, 2017

旋涡池化：在语义分割中改善上下文表示

通过引入 Vortex Pooling 方法，本文提出了一种有效而高效的语义分割方法，该方法在 PASCAL VOC 2012 中超越了现有的最先进模型 DeepLab v3，并且具有与 DeepLab v3 相似的计算代价。

Apr, 2018

语义分割自动对焦层

本研究提出自适应对焦卷积层用于语义分割，通过并行合并多个不同膨胀率的卷积层及注意力机制，该卷积层可以根据处理后的上下文自适应地改变有效感受野的大小，提高网络的多尺度处理能力和特征提取能力，且可以轻松地集成到已有的网络中。我们在盆腔 CT 和脑部 MRI 分割等具有挑战性的任务上评估了该方法，获得了非常有希望的性能表现。

May, 2018

实时语义分割中，对膨胀卷积的再思考

本研究设计了一种双并行、使用不同扩张率的卷积层的 ResNeXt，以提高区域感知率和保留局部细节，进而实现语义分割，并在实时 Cityscapes 和 CamVid 数据集上取得迄今最优成果。

Nov, 2021