多尺度格网盖伯注意力用于卷积神经网络中的卷积层分割

Jul, 2024

多尺度格网盖伯注意力用于卷积神经网络中的卷积层分割

Multi-scale gridded Gabor attention for cirrus segmentation

Felix Richards, Adeline Paiement, Xianghua Xie, Elisabeth Sola, Pierre-Alain Duc

TL;DR本文针对分割大型图像中的全球污染物的挑战进行了研究，通过处理多尺度特征并提出网格化注意机制，大大增加了效率。在新的天文图像数据集上展示了分割大型污染尘埃云的结果。

Abstract

In this paper, we address the challenge of segmenting global contaminants in large images. The precise delineation of such structures requires ample global context alongside understanding of textural patterns.

发现论文，激发创造

DeepLab：通过深度卷积网络，空洞卷积和全连接CRF进行语义图像分割

本文提出了一种利用Deep Learning完成语义图像分割的方法，通过引入atrous convolution以及atrous spatial pyramid pooling来解决对象掩模问题，并结合max-pooling和downsampling与全连接条件随机场（CRF）来提高对象边界的定位准确性，在PASCAL VOC-2012等数据集上全面超越了以往的成果。

Jun, 2016

卷积定向边界: 从图像分割到高级任务

本文提出了一种名为Convolutional Oriented Boundaries (COB)的方法，该方法通过图像分类卷积神经网络（CNNs）产生多尺度的定向轮廓和区域层次结构，其具有高效的计算性能和显著的识别性能，并且泛化性能也很好。我们在多个数据集上验证了COB的性能，并通过与不同任务的结合，如目标提议，语义轮廓，语义分割和目标检测等，证明COB在提高多种任务的性能方面也具有良好的效果。

Jan, 2017

基于注意力机制的多尺度网格去雾网络

GridDehazeNet是一种端到端可训练的卷积神经网络，用于单图像去雾。其包括预处理、骨干和后处理三个模块，在预处理模块中可以生成具有更好多样性和相关特征的输入。骨干模块实现基于注意力的多尺度估计，可以有效缓解传统多尺度方法中经常遇到的瓶颈问题。后处理模块有助于减少最终输出中的伪影。实验结果表明，GridDehazeNet在合成和实际场景中都优于现有技术。提出的去雾方法不依赖于大气散射模型，并解释了为什么即使只考虑合成图像上的去雾结果，利用大气散射模型的降维优势也未必有益。

Aug, 2019

三维点云语义分割的点注意力网络

本研究提出了一种点关注网络，它可以在对3D点云进行语义分割时学习丰富的本地形状特征和上下文相关性，并代替传统卷积核或参数共享机制来更有效地处理稀疏的3D点云。实验表明，该算法能够与现有的最先进方法同等或更好地处理各种3D点云。

Sep, 2019

使用地理空间注意力重新审视近/远距离感知

介绍了一种基于大地空间注意力机制的近/远距离感知方法，该方法结合了空中和地面图像的几何特征和外观，提高了分割任务的准确性。实验结果显示，该方法显著优于之前的最先进方法。

Apr, 2022

多兆像素图像中微小物体的交互式分割和可视化

介绍了一个互动的图像分割和可视化框架，用于识别、检查和编辑大型多兆像素高动态范围（HDR）图像中微小物体(仅有几个像素宽)，特征集不仅适用于天文数据，而且可以成为科学领域(如生物医学、材料科学、遥感等)和计算机视觉中人机协同小物体分割的有用研究支持工具。该工具可以方便地托管在Web上，为任何设备提供多用户访问和GPU加速。

Apr, 2022

SA2-Net：用于显微图像分割的尺度感知注意力网络

提出了一种名为SA2-Net的方法，利用多尺度特征学习来有效处理微观图像中的不同结构，通过尺度感知注意力模块实现对微观区域的准确分割，并通过自适应上采样模块解决了模糊边界的问题。

Sep, 2023

xT：用于大图像中更大上下文的嵌套标记化

现代计算机视觉流水线处理大图像的方式可以分为两种：降采样或裁剪。但这两种方法都会导致图像中信息和上下文的严重损失。我们引入了一个名为xT的简单框架，可以在当今的GPU上端到端地对大图像进行全局上下文与局部细节的有效聚合建模。我们选择了一组经典视觉任务的基准数据集来准确反映视觉模型在理解真实大图像、融合大尺度细节方面的能力，并评估了我们的方法在这些任务上的改进效果。通过在处理自然语言的长序列模型中引入针对大图像的嵌套分词方案，我们能够在具有挑战性的分类任务中将准确度提高多达8.6％，并将$F_1$分数提高11.6％，适用于大图像中的上下文相关分割。

Mar, 2024

AMMUNet: 遥感图像分割的多尺度注意力地图融合

AMMUNet是一种基于UNet的框架，通过多尺度注意力图合并实现全局建模，用于精确的遥感语义分割，并取得了优越的性能。

Apr, 2024

低表面亮度图像中星系结构的全景分割

利用深度学习来定位低表面亮度图像中的星系结构，采用一种新颖的联合方法，结合Mask R-CNN和污染物专用网络，利用自适应预处理层更好地捕捉低表面亮度图像的微妙特征，同时使用人为干预的训练方案提高星系结构和污染物在低表面亮度图像中的检测效果。

Jul, 2024