空洞卷积多尺度上下文聚合

ICLRNov, 2015

Multi-Scale Context Aggregation by Dilated Convolutions

Fisher Yu, Vladlen Koltun

TL;DR本文提出了一种特别为密集预测设计的新的卷积网络模块，该模块利用扩张卷积系统地汇集多尺度上下文信息，而不会丢失分辨率，并证明了该模块可以提高现有最先进的语义分割系统的精度。同时，作者还探究了将图像分类网络适应于密集预测的可能性，并提出了简化适应后的网络结构有助于提高精度。

Abstract

State-of-the-art models for semantic segmentation are based on adaptations of convolutional networks that had originally been designed for image classification. However, →

semantic segmentation convolutional networks dense prediction context module dilated convolutions

发现论文，激发创造

用于密集预测任务的密集连接多扩张卷积网络

本文介绍了一种新的用于高分辨率密集预测的卷积神经网络架构，称为 D3Net，其采用了多分辨率学习和逐渐膨胀的感受野来同时建模局部和全局模式，避免了深度网络中的深度耗散问题，并在图像和音频处理任务中取得了优越的性能。

Nov, 2020

基于语义单元的膨胀卷积用于多标签文本分类

该研究提出了一种基于序列到序列学习的多标签文本分类模型，其使用了多级膨胀卷积和相应的混合注意机制来生成更高级的语义单元表示，并且有效地减少了维度和支持了接收域的指数级扩展。实验结果表明，该模型在数据集 RCV1-V2 和 Ren-CECps 上具有显著优势，并且分析表明该模型与确定性分层模型相当，同时更具有对低频标签进行分类的鲁棒性。

Aug, 2018

一个聚合的多列扩张卷积神经网络用于无视角计数

本文提出利用扩张滤波器来构建聚合模块，以实现无透视计数的多列卷积神经网络。实验证明，我们的方法在许多基准数据集上胜过现有技术，并且结合更高数量的列来使用我们的聚合模块对于多尺度计数是有益的。

Apr, 2018

理解卷积在语义分割中的应用

该论文提出了一种改进像素级语义分割的深度学习方法，其中涵盖了密集上采样卷积和混合空洞卷积框架，达到了在 Cityscapes 等数据集上的最先进结果。

Feb, 2017

基于膨胀卷积的多尺度信息学习 Inception 模块的单幅图像超分辨率

本文提出了基于扩张卷积的 Inception 模块，利用多尺度信息构建深度神经网络，提高单幅图像超分辨率的性能。实验结果表明，该方法优于许多单幅图像超分辨率方法。

Jul, 2017

基于上下文聚合网络的实时语义分割

该论文提出了一种上下文聚合网络，通过较低的计算成本实现了准确的图像场景分割，适用于自主系统及实时应用。

Nov, 2020

用于腹部多器官分割的多尺度金字塔 3D 全卷积网络

本文提出一种新的方法通过采用自动上下文来利用多尺度堆叠 3D FCN 金字塔，从而提高分辨率执行语义分割。我们在手动注释的 377 个胃手术的 CT 影像数据集上训练和验证模型，并获得近 90％的 Dice 分数。

Jun, 2018

实时语义分割中，对膨胀卷积的再思考

本研究设计了一种双并行、使用不同扩张率的卷积层的 ResNeXt，以提高区域感知率和保留局部细节，进而实现语义分割，并在实时 Cityscapes 和 CamVid 数据集上取得迄今最优成果。

Nov, 2021

卷积网络基于动态多上下文遥感图像分割

本研究提出了一种利用多层感知域适用于遥感图像的语义分割的新技术，通过训练一个具有不同感知域的扩张网络，从多种异质性环境下获取信息，从训练样本中定义最佳输入补丁大小，显著提高了像素分类精度。

Apr, 2018

多尺度细化的注意力语义分割

本文提出了一种新颖的注视模型用于语义分割，该模型聚合了多尺度和上下文特征进行预测。该模型使用骨骼卷积神经网络框架输入多个不同的尺度，进而可以获取不同尺度的表示。提出的注视模型将分别处理不同尺度的特征并集成它们。然后，该模型的位置注视分支学习到每个像素位置上的多尺度特征的软加权。此外，我们添加了一个重新校准分支，与位置注视分支平行，用于重新校准每个类别的分数图。在 PASCAL VOC 2012 和 ADE20K 数据集上，我们取得了相当有竞争力的结果，超过了基线和相关工作。

Jul, 2018