水游蛇:水下图像增强的视觉状态空间模型
使用 PixMamba 和 State Space Models,PixMamba 能够有效地处理水下图像增强的问题,提供了全局依赖建模的能力,并通过 EMNet 和 PixNet 两级策略实现了高效的全局上下文信息获取和视觉上更好的结果。
Jun, 2024
重建退化图像的关键任务在图像处理中非常重要,我们引入了基于通道感知的 U 形曼巴模型,它融合了双状态空间模型(SSM)框架与 U-Net 架构,通过引入空间 SSM 模块和通道 SSM 组件,它能够线性计算的复杂度相对于特征图大小进行全局上下文编码和保留通道相关特征,从而在图像恢复方面优于现有的最先进方法,凸显了整合空间和通道上下文的重要性。
Apr, 2024
通过引入选择性状态空间建模 (SSM) 来捕捉远程上下文并保持局部精度,提出了一种新型对抗性模型 I2I-Mamba,该模型在卷积骨干网络的瓶颈中注入通道混合 Mamba (cmMamba) 块,综合报告了多对比度 MRI 和 MRI-CT 协议中缺失图像的完整演示,研究结果表明,I2I-Mamba 在合成目标模态图像方面优于现有的基于 CNN 和 Transformer 的方法。
May, 2024
在医学图像分割领域,CNN 和 Transformer 基于模型已经进行了深入研究。然而,CNN 对长距离依赖的建模能力有限,使得充分利用图像内的语义信息变得具有挑战性。另一方面,Transformer 的二次计算复杂性提出了挑战。最近,基于状态空间模型(SSMs)的方法,如 Mamba,被认为是一种有希望的方法。它们不仅在建模长程交互方面表现出卓越性能,而且保持了线性计算复杂性。受到 Mamba 架构的启发,我们提出了 Vision Mamba-UNetV2,引入了 Visual State Space(VSS)块来捕捉广泛的上下文信息,引入 Semantics and Detail Infusion(SDI)来增强低级和高级特征的融合。我们在 ISIC17、ISIC18、CVC-300、CVC-ClinicDB、Kvasir、CVC-ColonDB 和 ETIS-LaribPolypDB 等公共数据集上进行了全面的实验。结果表明,VM-UNetV2 在医学图像分割任务中表现出竞争力。我们的代码可在此网址获得
Mar, 2024
图像融合是通过将具有有限光谱信息的高分辨率图像与具有丰富光谱数据的低分辨率图像相结合,生成高分辨率的多 / 高光谱图像。本文提出了一种名为 FusionMamba 的创新方法,通过在两个 U 型网络中结合 Mamba 块,以一种高效、独立和分级的方式提取空间和光谱特征,进而有效地将空间和光谱信息进行融合,得到了优于其他融合技术的性能,证明了 FusionMamba 的有效性。
Apr, 2024
本研究提出了一种基于状态空间模型的医学图像分割模型 Vision Mamba UNet (VM-UNet),通过引入 Visual State Space (VSS) 块以捕获广泛的上下文信息,并构建了一个不对称的编码器 - 解码器结构。实验结果表明,VM-UNet 在医学图像分割任务中具有竞争力。此外,该模型是首个基于纯 SSM 模型构建的医学图像分割模型,旨在为未来开发更高效、更有效的 SSM 分割系统奠定基础并提供有价值的见解。
Feb, 2024
该研究通过引入 Mamba 模型和协同完成模块,提出了一种新型双分支网络 RS3Mamba,用于遥感图像语义分割任务,并在 ISPRS Vaihingen 和 LoveDA Urban 数据集上进行了实验证明其有效性和潜力。
Apr, 2024