Mar, 2024

CMViM:用于 AD 分类的 3D 多模态表征学习的对比掩码 Vim 自编码器

TL;DR我们提出了一种针对 3D 多模态数据的首个高效表示学习方法 Contrastive Masked Vim Autoencoder(CMViM),该方法利用传统的 Vision Mamba(Vim)自动编码器结构实现对三维医学图像的统一多模态表示,通过内部对比度学习模块和跨模态对比度学习模块来增强其判别特征建模能力,并在 AD 分类任务中验证,与其他最先进方法相比,提高了 2.7%的 AUC 性能。