VM-DDPM:医学图像合成的视觉曼巴扩散
本研究提出了一种基于状态空间模型的医学图像分割模型 Vision Mamba UNet (VM-UNet),通过引入 Visual State Space (VSS) 块以捕获广泛的上下文信息,并构建了一个不对称的编码器 - 解码器结构。实验结果表明,VM-UNet 在医学图像分割任务中具有竞争力。此外,该模型是首个基于纯 SSM 模型构建的医学图像分割模型,旨在为未来开发更高效、更有效的 SSM 分割系统奠定基础并提供有价值的见解。
Feb, 2024
在医学图像分割领域,CNN 和 Transformer 基于模型已经进行了深入研究。然而,CNN 对长距离依赖的建模能力有限,使得充分利用图像内的语义信息变得具有挑战性。另一方面,Transformer 的二次计算复杂性提出了挑战。最近,基于状态空间模型(SSMs)的方法,如 Mamba,被认为是一种有希望的方法。它们不仅在建模长程交互方面表现出卓越性能,而且保持了线性计算复杂性。受到 Mamba 架构的启发,我们提出了 Vision Mamba-UNetV2,引入了 Visual State Space(VSS)块来捕捉广泛的上下文信息,引入 Semantics and Detail Infusion(SDI)来增强低级和高级特征的融合。我们在 ISIC17、ISIC18、CVC-300、CVC-ClinicDB、Kvasir、CVC-ColonDB 和 ETIS-LaribPolypDB 等公共数据集上进行了全面的实验。结果表明,VM-UNetV2 在医学图像分割任务中表现出竞争力。我们的代码可在此网址获得
Mar, 2024
Medical image classification using Vision Mamba, a novel Conv-SSM module that combines convolutional layers with state space model, demonstrates promising results in detecting lesions, establishing a new baseline for the field.
Mar, 2024
通过引入选择性状态空间建模 (SSM) 来捕捉远程上下文并保持局部精度,提出了一种新型对抗性模型 I2I-Mamba,该模型在卷积骨干网络的瓶颈中注入通道混合 Mamba (cmMamba) 块,综合报告了多对比度 MRI 和 MRI-CT 协议中缺失图像的完整演示,研究结果表明,I2I-Mamba 在合成目标模态图像方面优于现有的基于 CNN 和 Transformer 的方法。
May, 2024
通过分析多次扫描策略在多尺度视觉任务中的成功原因,本研究介绍了 Multi-Scale Vision Mamba(MSVMamba)模型,采用多尺度二维扫描技术并整合了卷积前馈网络(ConvFFN),在有限参数下保留了 State Space Models(SSMs)在视觉任务中的卓越性能。
May, 2024
通过将 State Space Sequence Models (SSMs) 整合到卷积残差块中,nnMamba 架构能够提取局部特征并建模复杂的依赖关系,从而在医学图像分析的一系列挑战性任务中展现出卓越的性能。
Feb, 2024
本研究旨在使用潜在扩散模型(Latent Diffusion Model)对 CT 进行 MRI 转换,并将常用的 U-Net 或 Transformer 骨干换成一种名为 Mamba 的状态空间模型。实验证明 DiffMa 在医学图像生成任务中表现出令人印象深刻的性能,并在输入缩放效率方面具有明显优势。
Jun, 2024
通过使用残差 VSS 模块进行深度上下文特征提取,以及使用 Triplet SSM 在空间和通道维度上融合特征,我们的 TM-UNet 在多个数据集上展示了卓越的分割性能,并且相较于之前的 VM-UNet 减少了三分之一的参数。
Mar, 2024