多尺度格网盖伯注意力用于卷积神经网络中的卷积层分割
本文提出了一种利用Deep Learning完成语义图像分割的方法,通过引入atrous convolution以及atrous spatial pyramid pooling来解决对象掩模问题,并结合max-pooling和downsampling与全连接条件随机场(CRF)来提高对象边界的定位准确性,在PASCAL VOC-2012等数据集上全面超越了以往的成果。
Jun, 2016
本文提出了一种名为Convolutional Oriented Boundaries (COB)的方法,该方法通过图像分类卷积神经网络(CNNs)产生多尺度的定向轮廓和区域层次结构,其具有高效的计算性能和显著的识别性能,并且泛化性能也很好。我们在多个数据集上验证了COB的性能,并通过与不同任务的结合,如目标提议,语义轮廓,语义分割和目标检测等,证明COB在提高多种任务的性能方面也具有良好的效果。
Jan, 2017
GridDehazeNet是一种端到端可训练的卷积神经网络,用于单图像去雾。其包括预处理、骨干和后处理三个模块,在预处理模块中可以生成具有更好多样性和相关特征的输入。骨干模块实现基于注意力的多尺度估计,可以有效缓解传统多尺度方法中经常遇到的瓶颈问题。后处理模块有助于减少最终输出中的伪影。实验结果表明,GridDehazeNet在合成和实际场景中都优于现有技术。提出的去雾方法不依赖于大气散射模型,并解释了为什么即使只考虑合成图像上的去雾结果,利用大气散射模型的降维优势也未必有益。
Aug, 2019
本研究提出了一种点关注网络,它可以在对3D点云进行语义分割时学习丰富的本地形状特征和上下文相关性,并代替传统卷积核或参数共享机制来更有效地处理稀疏的3D点云。实验表明,该算法能够与现有的最先进方法同等或更好地处理各种3D点云。
Sep, 2019
介绍了一种基于大地空间注意力机制的近/远距离感知方法,该方法结合了空中和地面图像的几何特征和外观,提高了分割任务的准确性。实验结果显示,该方法显著优于之前的最先进方法。
Apr, 2022
介绍了一个互动的图像分割和可视化框架,用于识别、检查和编辑大型多兆像素高动态范围(HDR)图像中微小物体(仅有几个像素宽),特征集不仅适用于天文数据,而且可以成为科学领域(如生物医学、材料科学、遥感等)和计算机视觉中人机协同小物体分割的有用研究支持工具。该工具可以方便地托管在Web上,为任何设备提供多用户访问和GPU加速。
Apr, 2022
提出了一种名为SA2-Net的方法,利用多尺度特征学习来有效处理微观图像中的不同结构,通过尺度感知注意力模块实现对微观区域的准确分割,并通过自适应上采样模块解决了模糊边界的问题。
Sep, 2023
现代计算机视觉流水线处理大图像的方式可以分为两种:降采样或裁剪。但这两种方法都会导致图像中信息和上下文的严重损失。我们引入了一个名为xT的简单框架,可以在当今的GPU上端到端地对大图像进行全局上下文与局部细节的有效聚合建模。我们选择了一组经典视觉任务的基准数据集来准确反映视觉模型在理解真实大图像、融合大尺度细节方面的能力,并评估了我们的方法在这些任务上的改进效果。通过在处理自然语言的长序列模型中引入针对大图像的嵌套分词方案,我们能够在具有挑战性的分类任务中将准确度提高多达8.6%,并将$F_1$分数提高11.6%,适用于大图像中的上下文相关分割。
Mar, 2024
利用深度学习来定位低表面亮度图像中的星系结构,采用一种新颖的联合方法,结合Mask R-CNN和污染物专用网络,利用自适应预处理层更好地捕捉低表面亮度图像的微妙特征,同时使用人为干预的训练方案提高星系结构和污染物在低表面亮度图像中的检测效果。
Jul, 2024