面向图像分类的空间关注输出层
本研究提出了一种新的参数 - free 的空间注意力层来建模高层特征之间的空间关系,该层相比于没有该层的模型有显著的性能改进,并在四个基准测试中实现了最先进的结果,其中 Market-1501 的 rank-1 准确度为 94.7%,DukeMTMC-ReID 的 rank-1 准确度为 89.0%,CUHK03-labeled 和 CUHK03-detected 的 rank-1 准确度分别为 74.9%和 69.7%。
Nov, 2018
本文提出了一种基于卷积递归神经网络的时空关注池化层,用于学习判别性模式并抑制与声学场景分类无关的模式。实验证明该方法不仅优于强卷积神经网络基线,还在 LITIS Rouen 数据库上取得了新的最优性能。
Apr, 2019
本文提出了一种注意力分布特征 (ADL) 的弱监督目标定位技术,利用自注意机制对模型的特征图进行处理,旨在实现对目标的完整覆盖和信息突出。实验证明该方法有效提高了目标识别率和检测精度,在 CUB-200-2011 数据集中实现了最新的定位精度记录。
Aug, 2019
本文介绍了一种新的卷积神经网络 SCA-CNN,其中引入了空间和通道注意力,用于图像描述任务,结果表明 SCA-CNN 明显优于现有的基于视觉关注的图像描述方法。
Nov, 2016
该研究提出了一个名为 GCPANet 的新网络,采用一些渐进式的、上下文感知的特征交织聚合 (FIA) 模块有效地整合低层外观特征、高层语义特征和全局上下文特征,并通过监督学习生成显着性图像。此外,还设计了一个头部注意力 (HA) 模块、一个自我细化 (SR) 模块和一个全局上下文流 (GCF) 模块,以进一步提高网络性能。实验结果表明,该方法在六个基准数据集上的表现比现有方法都要好。
Mar, 2020
本文研究了全局平均池化技术在卷积神经网络中应用的原理,发现其可以使网络更好地实现局部特征定位,从而建立了一种通用的可局部化的深层表示方法,并通过实验证明其在物体定位等各种任务上的有效性。
Dec, 2015
本文介绍了一种基于 SPAP 的建筑单元的学习方法,该方法可以轻松地集成到 GAN 和 CycleGAN 的生成器和鉴别器中,以促进有效的端到端生成式学习,在 Celeba-HQ-128 和 Image-to-Image 翻译数据集上得到了更好的性能。
Jan, 2019
本研究提出一种基于主成分分析的互动感知自注意模型,通过利用多尺度信息构建空间金字塔,实现对特征图中所有空间位置的本地特征加权得到注意图,并将其嵌入卷积神经网络中以形成端到端的注意力网络,实现动作分类中的最先进结果。
Aug, 2018
通过使用新颖的自注意力模块,将全局特征反映到局部特征和局部接受域,以及优化解耦头和 AB-OTA,我们提出的模型在大中小型模型上能够实现 49.0%(71FPS,14ms),46.1%(85FPS,11.7ms)和 39.1%(107FPS,9.3ms)的平均精度,超过了 YOLOv5 0.8%-3.1% 的平均精度。
Jun, 2022
本篇论文提出了一种高效的局部注意力 (ELA) 方法,该方法通过引入 1D 卷积和分组归一化特征增强技术,实现了在不通过降维的情况下,精确定位感兴趣区域的目标,并且具备轻量级的实现。在 ImageNet、MSCOCO 和 Pascal VOC 数据集上的广泛评估表明,ELA 模块在图像分类、目标检测和语义分割等三个视觉任务中优于当前最先进的方法。
Mar, 2024