面向图像分类的空间关注输出层

CVPRApr, 2020

Spatially Attentive Output Layer for Image Classification

Ildoo Kim, Woonhyuk Baek, Sungwoong Kim

TL;DR本文提出了一个新颖的空间输出层，用于在现有的卷积特征图顶部显式地利用位置特异的输出信息。通过在空间逻辑中采用注意力蒙版，选择性地聚合目标区域内的空间逻辑，不仅提高了性能，还实现了空间可解释输出。在各种分类任务中的实验结果表明，提出的空间输出层在几乎相同的计算成本下实现了稳定的性能改进。

Abstract

Most convolutional neural networks (CNNs) for image classification use a global average pooling (GAP) followed by a fully-connected (FC) layer for output logits. However, this spatial aggregation procedure inherently restricts the utilization of →

convolutional neural networks spatial output layer location-specific information self-supervision self-distillation

发现论文，激发创造

无参数空间注意力网络用于人员再识别

本研究提出了一种新的参数 - free 的空间注意力层来建模高层特征之间的空间关系，该层相比于没有该层的模型有显著的性能改进，并在四个基准测试中实现了最先进的结果，其中 Market-1501 的 rank-1 准确度为 94.7％，DukeMTMC-ReID 的 rank-1 准确度为 89.0％，CUHK03-labeled 和 CUHK03-detected 的 rank-1 准确度分别为 74.9％和 69.7％。

Nov, 2018

音频场景分类的时空注意池化

本文提出了一种基于卷积递归神经网络的时空关注池化层，用于学习判别性模式并抑制与声学场景分类无关的模式。实验证明该方法不仅优于强卷积神经网络基线，还在 LITIS Rouen 数据库上取得了新的最优性能。

Apr, 2019

基于注意力机制的弱监督目标定位的 Dropout 层

本文提出了一种注意力分布特征 (ADL) 的弱监督目标定位技术，利用自注意机制对模型的特征图进行处理，旨在实现对目标的完整覆盖和信息突出。实验证明该方法有效提高了目标识别率和检测精度，在 CUB-200-2011 数据集中实现了最新的定位精度记录。

Aug, 2019

SCA-CNN：用于图像字幕的卷积网络中的空间和通道注意力

本文介绍了一种新的卷积神经网络 SCA-CNN，其中引入了空间和通道注意力，用于图像描述任务，结果表明 SCA-CNN 明显优于现有的基于视觉关注的图像描述方法。

Nov, 2016

全局上下文感知逐步聚合网络用于显著性目标检测

该研究提出了一个名为 GCPANet 的新网络，采用一些渐进式的、上下文感知的特征交织聚合 (FIA) 模块有效地整合低层外观特征、高层语义特征和全局上下文特征，并通过监督学习生成显着性图像。此外，还设计了一个头部注意力 (HA) 模块、一个自我细化 (SR) 模块和一个全局上下文流 (GCF) 模块，以进一步提高网络性能。实验结果表明，该方法在六个基准数据集上的表现比现有方法都要好。

Mar, 2020

基于深度特征的判别定位学习

本文研究了全局平均池化技术在卷积神经网络中应用的原理，发现其可以使网络更好地实现局部特征定位，从而建立了一种通用的可局部化的深层表示方法，并通过实验证明其在物体定位等各种任务上的有效性。

Dec, 2015

图像合成和图像到图像翻译中的学习空间金字塔注意池化

本文介绍了一种基于 SPAP 的建筑单元的学习方法，该方法可以轻松地集成到 GAN 和 CycleGAN 的生成器和鉴别器中，以促进有效的端到端生成式学习，在 Celeba-HQ-128 和 Image-to-Image 翻译数据集上得到了更好的性能。

Jan, 2019

交互感知的时空金字塔注意力网络用于动作分类

本研究提出一种基于主成分分析的互动感知自注意模型，通过利用多尺度信息构建空间金字塔，实现对特征图中所有空间位置的本地特征加权得到注意图，并将其嵌入卷积神经网络中以形成端到端的注意力网络，实现动作分类中的最先进结果。

Aug, 2018

YOLOSA 基于 2D 局部特征叠加自注意力的物体检测

通过使用新颖的自注意力模块，将全局特征反映到局部特征和局部接受域，以及优化解耦头和 AB-OTA，我们提出的模型在大中小型模型上能够实现 49.0%（71FPS，14ms），46.1%（85FPS，11.7ms）和 39.1%（107FPS，9.3ms）的平均精度，超过了 YOLOv5 0.8%-3.1% 的平均精度。

Jun, 2022

ELA：深度卷积神经网络的高效局部注意力

本篇论文提出了一种高效的局部注意力 (ELA) 方法，该方法通过引入 1D 卷积和分组归一化特征增强技术，实现了在不通过降维的情况下，精确定位感兴趣区域的目标，并且具备轻量级的实现。在 ImageNet、MSCOCO 和 Pascal VOC 数据集上的广泛评估表明，ELA 模块在图像分类、目标检测和语义分割等三个视觉任务中优于当前最先进的方法。

Mar, 2024