- LFMamba: 具有状态空间模型的光场图像超分辨率
近年来,随着现代神经网络的进步,光场图像超分辨率(LFSR)取得了显著的进展。然而,这些方法往往在捕捉长距离依赖关系(基于 CNN)或遇到二次计算复杂性(基于 Transformer)方面面临挑战,从而限制了它们的性能。最近,基于状态空间模 - IJCAISpoT-Mamba:在时空图上学习长距离依赖关系与选择状态空间
SpoT-Mamba 是一个新的 STG 预测框架,利用 Mamba 的长程依赖性来生成节点嵌入,通过节点嵌入进行时间扫描以捕捉长期的时空依赖性,并在实际交通预测数据集上展示了其有效性。
- SHMamba: 面向音视频问答的结构化双曲线状态空间模型
提出了 SHMamba:结构化双曲状态空间模型,利用双曲几何和状态空间模型的优势,表示音频 - 视觉数据的分层结构和复杂关系。通过引入自适应曲率双曲对齐模块和交叉融合块,增强分层结构的理解和跨模态信息的动态交流。广泛实验证明,SHMamba - C-Mamba: 增强通道关联的状态空间模型用于多变量时间序列预测
提出了一种名为 C-Mamba 的基于状态空间模型的多变量时间序列预测方法,通过混合通道和通道注意力增强的方式来捕捉跨通道依赖关系,获得了在七个真实世界时间序列数据集上的最先进性能,同时其混合和注意力策略在其他框架中表现出强大的泛化能力。
- RoboMamba: 高效机器人推理和操作的多模态状态空间模型
通过集成视觉编码器与 Mamba 模型,RoboMamba 同时提供了机器人推理和动作能力,并且在模型的微调和推断过程中保持了高效的计算速度。
- 从统一视角解开线性复杂度序列模型的秘密
我们提出了线性复杂度序列模型(LCSM),将各种序列建模技术(包括线性注意力、状态空间模型、长卷积和线性 RNN 等)以及展开、振荡和收缩(EOS)三个不同阶段的建模过程融入一个统一的框架中。通过从一个连贯而简化的视角分析每个组成部分的影响 - 解读视觉中的莽巴:线性注意力视角
探索了 Mamba 模型与线性注意力 Transformer 之间的相似性和差异性,发现忘记门和块设计是 Mamba 模型成功的核心因素,并通过融合这两个关键设计提出了 Mamba-Like Linear Attention (MLLA) - 高效的图像去模糊视觉状态空间模型
本文提出了一种简单而有效的视觉状态空间模型(EVSSM)用于图像去模糊,在图像恢复任务中,相比卷积神经网络(CNNs)和视觉 Transformer(ViTs),EVSSM 相对于其它方法在基准数据集和真实捕捉的图像上表现出色。
- 水游蛇:水下图像增强的视觉状态空间模型
该研究提出了一种名为 WaterMamba 的 UIE 的状态空间模型,其计算复杂度低、参数量减少且在各种数据集上表现优越,通过模拟像素和通道信息流、调整信息流和促进 SCCOSS 模块内的同步操作来提高图像质量。
- MambaOut:我们是否真的需要 Mamba 来进行视觉任务?
Mamba 适用于具有长序列和自回归特性的任务,但不适用于图像分类;Mamba 在目标检测和分割任务中表现不如注意力模型,但显示出在长序列视觉任务中的潜力。
- VM-DDPM:医学图像合成的视觉曼巴扩散
基于 SMM-CNN 混合结构的 Vision Mamba DDPM(VM-DDPM)用于医学图像合成,通过多级状态空间块(MSSBlock)、状态空间层(SSLayer)和交叉扫描模块(CSM)等方法,在三个不同规模的数据集上取得最先进的 - StyleMamba:高效的文本驱动图像风格转换的状态空间模型
StyleMamba 是一种有效的图像风格转换框架,通过将文本提示转化为相应的视觉风格来保持原始图像的内容完整性。它通过引入条件状态空间模型来加快处理速度,并且通过使用遮罩和二阶方向损失来优化风格化方向,从而大幅减少训练迭代次数和推理时间。 - Vision Mamba: 一项综合调查与分类
Mamba 是一种新型的人工智能架构,基于最新的状态空间模型,具有强大的效率和长距离依赖建模能力,被广泛应用于深度学习中的自然语言处理和视觉领域。本综述研究了 Mamba 在视觉任务和数据类型上的应用,探讨了其前身、最新进展以及对各领域的深 - MemoryMamba:记忆增强的状态空间模型用于缺陷识别
自动化制造中的缺陷检测技术需求增长,但现有视觉模型在处理复杂的制造场景中的缺陷识别方法方面不足。本研究提出了 MemoryMamba,一种新颖的记忆增强状态空间模型 (SSM),旨在克服现有缺陷识别模型的局限性。MemoryMamba 集成 - 从泛化分析到状态空间模型的优化设计
本文研究了状态空间模型(SSM)的普适性,并提出基于普适性结果改进训练算法的方法。具体地,我们给出了一种依赖数据的 SSM 普适性界限,展示了 SSM 参数与训练序列的时间依赖性之间的相互作用。基于该普适性界限,我们(1)建立了一个基于提出 - Mamba-FETrack: 基于状态空间模型的帧事件跟踪
RGB-Event based tracking framework, Mamba-FETrack, utilizing State Space Model achieves high-performance tracking while - S$^2$Mamba:一种面向高光谱遥感图像分类的空间 - 光谱状态空间模型
通过创新性地提出 S^2Mamba,即一种适用于高光谱图像分类的空间 - 光谱状态空间模型,以发掘空间 - 光谱上下文特征,实现更高效准确的土地覆盖分析。
- 基于状态空间模型的光学多普勒层析成像稀疏重建
使用基于稀疏重建框架的光多普勒成像技术实现了高精度的血流图像重建,并且通过采用状态空间模型以及图像增强方法进一步提高了重建的准确性。
- 用于新一代网络替代 Transformer 的状态空间模型:概述
在这篇论文中,我们首次全面回顾了 State Space Model(SSM)作为自注意力基础的 Transformer 模型的特性和优势,并提供了实验比较和分析。此外,我们还研究了 SSM 在自然语言处理和计算机视觉等多个领域的应用,并提 - 一种用于图像融合的局部增强和状态共享的新型状态空间模型
基于 Mamba 算法的本地增强视觉 Mamba(LEVM)块和状态共享技术的图像融合网络(LE-Mamba)在多光谱和高光谱图像融合数据集上取得了最先进的结果,证明了该方法的有效性。