- GMSR:基于梯度引导的 RGB 图像谱重建方法
我们提出了一种名为 GMSR-Net 的轻量级模型,它通过全局接受域和线性计算复杂性特点,使用了多个堆叠的梯度 Mamba 块进行光谱重建,同时在空间和光谱提示上引入了新颖的梯度关注机制。与现有方法相比,GMSR-Net 大幅减少了参数和计 - MambaOut:我们是否真的需要 Mamba 来进行视觉任务?
Mamba 适用于具有长序列和自回归特性的任务,但不适用于图像分类;Mamba 在目标检测和分割任务中表现不如注意力模型,但显示出在长序列视觉任务中的潜力。
- 融入曼巴进行语音增强的研究
研究了一种可扩展的状态空间模型(SSM)Mamba,用于语音增强(SE)任务,利用基于 Mamba 的回归模型来表征语音信号,并在 Mamba 上构建了一个 SE 系统,命名为 SEMamba,在基本和高级 SE 系统中集成了 Mamba - Vision Mamba: 一项综合调查与分类
Mamba 是一种新型的人工智能架构,基于最新的状态空间模型,具有强大的效率和长距离依赖建模能力,被广泛应用于深度学习中的自然语言处理和视觉领域。本综述研究了 Mamba 在视觉任务和数据类型上的应用,探讨了其前身、最新进展以及对各领域的深 - 高光谱图像分类的光谱空间蛇纹石
该研究基于 Mamba 模型,提出了一种名为 SS-Mamba 的光谱空间分类方法,通过光谱 - 空间令牌生成模块和多个堆叠的光谱 - 空间 Mamba 块实现光谱和空间信息的融合,从而有效地进行高光谱图像分类。该方法在广泛使用的高光谱数据 - Vision Mamba: 模型、应用和挑战综述
在这篇综述性文章中,我们回顾了 Mamba 模型的起源和核心见解,并将 Mamba 应用于不同的计算机视觉任务。我们对各种图像、视频、点云、多模态等应用进行了分类和组织,为未来在这个快速发展的领域中提供了挑战和研究方向。
- RSCaMa:带有状态空间模型的遥感图像变化描述
远程感知图像变化字幕化通过识别多时相遥感图像中的表面变化并用自然语言描述它们,当前的方法通常依赖于编码器 - 解码器结构,并侧重于设计一个复杂的 “颈部” 来处理骨干提取的双时相特征。最近,状态空间模型(SSM),特别是 Mamba,在许多 - 关于视觉曼巴的调查
该研究综述了 Mamba 模型在计算机视觉领域的基本概念和优化方法,并介绍了它们在不同层次的视觉任务中的广泛应用,旨在引起学术界对当前挑战的关注并进一步应用 Mamba 模型于计算机视觉。
- 双向 Mamba4TS:用于时间序列预测的双向 Mamba
提出了一种名为 Bi-Mamba4TS 的双向 Mamba 模型,通过采用补丁技术丰富了局部信息并精细捕捉时间序列的演化模式,同时结合数据集特征选择更合适的建模方法,实验证明该模型在七个真实数据集上相较于现有方法获得了更准确的预测结果。
- Mamba3D:基于状态空间模型增强 3D 点云分析的本地特征
通过引入局部几何特征提取机制和双向状态空间模型(bi-SSM),Mamba3D 模型在点云学习中取得了超过 Transformer 的卓越性能、高效性和可扩展性,在多个任务中超越同类模型和并行研究,包括在 ScanObjectNN 任务中从 - FreqMamba:从频域视角观察 Mamba 以进行图像去雨
FreqMamba 是一种利用图像去雨的有效且高效的方法,通过扩展 Mamba 与频率分析的结合来解决频率建模所涉及的全局降解感知问题,并且在图像去雨任务中展示出优于现有方法的视觉和定量性能。
- 融合短吻鳄的跨模态物体检测
本文研究通过对改进的 Mamba 与门控机制在隐藏状态空间中关联交叉模态特征,设计了一个融合 Mamba 块(FMB)来将交叉模态特征映射到隐藏状态空间进行交互,从而降低交叉模态特征的差异性并增强融合特征的表征一致性;通过在公共数据集上进行 - 一种用于图像融合的局部增强和状态共享的新型状态空间模型
基于 Mamba 算法的本地增强视觉 Mamba(LEVM)块和状态共享技术的图像融合网络(LE-Mamba)在多光谱和高光谱图像融合数据集上取得了最先进的结果,证明了该方法的有效性。
- Simba: Mamba 增强的 U-ShiftGCN 用于视频中的动作识别
本研究提出了一种将 Mamba 引入骨架动作识别的框架,命名为 Simba,通过采用 U-ShiftGCN 结构、Shift S-GCN 模块和 Shift T-GCN 模块,以及中间和最终时间建模单元的整合,实现了领先水平的骨架动作识别效 - FusionMamba:基于状态空间模型的高效图像融合
图像融合是通过将具有有限光谱信息的高分辨率图像与具有丰富光谱数据的低分辨率图像相结合,生成高分辨率的多 / 高光谱图像。本文提出了一种名为 FusionMamba 的创新方法,通过在两个 U 型网络中结合 Mamba 块,以一种高效、独立和 - MambaAD:用于多类无监督异常检测的状态空间模型研究
应用 Mamba 到多类无监督异常检测,提出了包含预训练编码器和 Mamba 解码器的 MambaAD,通过在多个尺度上引入局部增强状态空间模块 (LSS),该方法在六个不同的异常检测数据集上展示了具有 SoTA 性能的结果,证实了其有效性 - RhythmMamba:快速远程生理测量与任意长度视频
使用 Mamba 为基础的 RhythmMamba 方法,通过多时间尺度的 Mamba 约束周期模式与短期趋势,并结合频域前馈使得 Mamba 能够牢固理解 rPPG 的准周期模式。大量实验证明,RhythmMamba 在减少参数和降低计算 - RS3Mamba: 对遥感图像语义分割的视觉状态空间模型
该研究通过引入 Mamba 模型和协同完成模块,提出了一种新型双分支网络 RS3Mamba,用于遥感图像语义分割任务,并在 ISPRS Vaihingen 和 LoveDA Urban 数据集上进行了实验证明其有效性和潜力。
- RSMamba:基于状态空间模型的遥感图像分类
RSMamba 是基于状态空间模型(SSM)和 Mamba 的高效、硬件感知设计的一种远程感知图像分类的新型架构,它通过动态多路径激活机制增强了模型对非因果数据的建模能力,并在多个远程感知图像分类数据集上展现出卓越的性能,具有成为未来视觉基 - RankMamba,在变形金刚时代评估 Mamba 的文档排名性能
通过在经典的 IR 任务 - 文档排序中考察 Mamba 的效果,我们发现 Mamba 模型在与具有相同训练方法的基于 Transformer 的模型相比具有有竞争力的性能,但与 flash attention 等高效的 Transform