多尺度细化的注意力语义分割

Jul, 2018

Attention to Refine through Multi-Scales for Semantic Segmentation

Shiqi Yang, Gang Peng

TL;DR本文提出了一种新颖的注视模型用于语义分割，该模型聚合了多尺度和上下文特征进行预测。该模型使用骨骼卷积神经网络框架输入多个不同的尺度，进而可以获取不同尺度的表示。提出的注视模型将分别处理不同尺度的特征并集成它们。然后，该模型的位置注视分支学习到每个像素位置上的多尺度特征的软加权。此外，我们添加了一个重新校准分支，与位置注视分支平行，用于重新校准每个类别的分数图。在 PASCAL VOC 2012 和 ADE20K 数据集上，我们取得了相当有竞争力的结果，超过了基线和相关工作。

Abstract

This paper proposes a novel attention model for semantic segmentation, which aggregates multi-scale and context features to refine prediction. Specifically, the skeleton →

attention model semantic segmentation convolutional neural network multi-scale features recalibrating branch

发现论文，激发创造

关注尺度：尺度感知的语义图像分割

本论文研究了怎样在卷积神经网络中实现多尺度特征表示，提出了一种注重对每个像素位置进行加权的注意力机制。通过对三个大型数据集的广泛实验，证明了该方法的有效性。

Nov, 2015

层次多尺度注意力用于语义分割

本文介绍了一种基于注意力机制的多尺度预测整合方法，其中的层次化结构能够节省大量内存，提高训练速度和模型精度，并在 Cityscapes 和 Mapillary Vistas 数据集上达到了新的最优结果。

May, 2020

医学图像分割的多尺度自引导注意力

采用引导自我关注机制的卷积神经网络模型对医学图像进行语义分割，能够更好地捕捉图像中的上下文依赖关系，去除冗余的信息提取并集成本地特征和全局依赖，强调相关特征关联，从而取得更好的分割效果。

Jun, 2019

用于人群计数的多尺度注意力网络

提出了一种使用多分支尺度感知注意力网络、卷积神经网络、软注意力机制、尺度感知损失函数等方法，在 4 个不同的人群计数数据集上实现了最先进的效果，平均减少 25% 的误差。

Jan, 2019

基于多尺度深度特征的视觉显著性

本文介绍了使用卷积神经网络进行图像视觉显著性建模的方法，采用新的神经网络结构和改进的空间相关性方法，同时使用多重分割提高了性能，实验表明我们提出的方法在公共基准测试中的表现优于目前已发表的最先进技术。

Mar, 2015

基于多尺度注意融合的自训练框架用于弱监督语义分割

提出一种利用多尺度类别感知度量融合的自训练方法，采集不同尺度的注意力图信息并应用去噪和激活策略来增强潜在区域和减少嘈杂区域，最后利用优化后的注意力图重新训练模型，实验证明该方法可以从多尺度图像提取丰富的语义信息，并在 PASCAL VOC 2012 验证集和测试集上实现了 72.4% 的平均交并比得分。

May, 2023

AutoScaler：用于视觉对应的缩放 - 注意力网络

本论文提出了 AutoScaler，一种通过权重共享的特征网络计算多尺度特征图并通过注意力网络实现最佳组合，从而在视觉对应任务中实现自适应感受野大小的规划。该网络与典型的光流和语义匹配基准方法相比具有更优秀的结果，并可推广至改善手动指定的描述符上进行视觉对应任务。同时，该注意力网络能够生成可视化的尺度注意力映射。

Nov, 2016

快速注意力实时语义分割

该论文提出一种新的 CNN 模型结构和快速空间注意力机制，能够在实时高分辨率图像和视频上进行语义分割，同时实现更好的准确性和速度。在 Cityscapes 数据集中，该模型在单个 Titan X GPU 上实现了 74.4％ mIoU 的 72 FPS 和 75.5％ mIoU 的 58 FPS，比现有方法快约 50％，并保持相同的准确性。

Jul, 2020

语义分割的压缩注意力网络

本文提出了一种新颖的挤压和注意力（SA）模块，结合传统卷积实现像素组关注和像素级预测，最终通过融合四个层次的 SANet 的输出来集成多尺度的上下文信息，从而实现了在 PASCAL VOC 和 PASCAL 上的语义分割任务中表现出色。

Sep, 2019

空洞卷积多尺度上下文聚合

本文提出了一种特别为密集预测设计的新的卷积网络模块，该模块利用扩张卷积系统地汇集多尺度上下文信息，而不会丢失分辨率，并证明了该模块可以提高现有最先进的语义分割系统的精度。同时，作者还探究了将图像分类网络适应于密集预测的可能性，并提出了简化适应后的网络结构有助于提高精度。

Nov, 2015