通过引入金字塔特征注意网络(PFANet),以提升高级上下文特征和低级空间特征,进一步改善深度估计中的空间布局、边界模糊和物体表面不连续等问题,并通过采用不同尺度的双尺度通道注意模块(DCAM),并以空间金字塔注意模块(SPAM)作为低级特征图中多尺度详细信息的引导来利用视觉特征的空间关系。最后,引入了尺度不变梯度损失,以增加对深度不连续区域中错误的惩罚。实验结果表明,我们的方法在 KITTI 数据集上优于最先进的方法。
Mar, 2024
本文提出了基于 Mask R-CNN 技术的文本检测新方法,应用金字塔注意力网络作为新的 Mask R-CNN 骨干网络以提高其特征表达能力,该方法可以统一地在自然场景图像中稳健地检测多定向和曲线文本,并在多种测试数据集上获得优越的性能。
Nov, 2018
提出了一种基于注意力机制的金字塔聚合网络(APANet),其中空间金字塔池化可以有效编码多尺度建筑物包含地理信息,而注意力模块则用于抑制混淆区域特征并突出辨别性特征,通过一种 PCA 白化策略在两个地点识别基准测试中表现优异。
Aug, 2018
提出了一种新颖的框架 Spatial Pyramid Attention Network (SPAN),用于检测和定位多种类型的图像篡改。该框架通过构建局部自注意力块的金字塔有效地建模了多尺度图像块之间的关系。SPAN 在通用的合成数据集上进行训练,但也可以对特定数据集进行微调;所提出的方法在标准数据集上显示出显著的性能提升,超过了之前最先进的方法。
Sep, 2020
本文介绍了一种用于 Panoptic 分割任务的新方法,即在 Mask R-CNN 模型中使用共享的 Feature Pyramid Network 实现对实体和语义分割任务的联合建模,该方法既能保持实体分割的高效性,而且还能实现语义分割的最佳性能。
Jan, 2019
我们提出了金字塔注意力网络(PAN)用于可变形医学图像配准,通过引入双流金字塔编码器和局部多头注意力变换器实现特征表示和分析运动模式,取得了较好的配准性能。
Feb, 2024
通过提出金字塔特征注意力网络来解决视觉注意力检测中如何提取有效特征的问题,该网络能够关注高层次的上下文特征和低层次的空间结构特征,并在这些特征图上应用通道注意和空间注意,然后将它们进行融合,最后通过边缘保护损失来引导网络学习边界定位中更详细的信息。在五个基准数据集上进行的广泛评估表明,该方法在不同的评估指标下优于现有的基准方法。
Mar, 2019
本研究提出了一种基于 CNN 的新型架构,可以进行端到端的训练,以提供无缝的场景分割结果。该网络结构采用了一种新颖的分割头,将由特征金字塔网络生成的多尺度特征与由轻量级 DeepLab 模块传递的上下文信息进行了无缝整合,从而预测一致的语义分割和检测结果。此外,研究人员还提出了一种替代 panoptic 度量的方法,克服了评估非实例类别时的局限性。通过在三个具有挑战性的街景数据集上测试,即 Cityscapes、Indian Driving Dataset 和 Mapillary Vistas,我们的网络架构取得了最先进的结果。
May, 2019
本文提出了一种新颖的挤压和注意力(SA)模块,结合传统卷积实现像素组关注和像素级预测,最终通过融合四个层次的 SANet 的输出来集成多尺度的上下文信息,从而实现了在 PASCAL VOC 和 PASCAL 上的语义分割任务中表现出色。
Sep, 2019
该研究提出了一种基于多尺度特征金字塔网络和双重注意机制的 MRI 图像分割方法,通过使用扩张卷积和多尺度特征金字塔网络在编码中避免了语义差距问题,并设计双重注意机制来维护 U-Net 的空间信息和降低不对齐问题。在亚腹部 MRI 图像数据集上的实验表明,该方法比其他方法表现更好。
May, 2023