LFMamba: 具有状态空间模型的光场图像超分辨率

Jun, 2024

LFMamba: 具有状态空间模型的光场图像超分辨率

LFMamba: Light Field Image Super-Resolution with State Space Model

Wang xia, Yao Lu, Shunzhou Wang, Ziqi Wang, Peiqi Xia...

TL;DR近年来，随着现代神经网络的进步，光场图像超分辨率（LFSR）取得了显著的进展。然而，这些方法往往在捕捉长距离依赖关系（基于 CNN）或遇到二次计算复杂性（基于 Transformer）方面面临挑战，从而限制了它们的性能。最近，基于状态空间模型（SSM）和选择性扫描机制（S6）的 Mamba 已成为各种视觉任务中传统 CNN 和 Transformer 方法的卓越替代方案，得益于其有效的长距离序列建模能力和线性时间复杂性。因此，将 S6 集成到 LFSR 中变得具有吸引力，特别是考虑到 4D 光场的大量数据量。然而，主要挑战在于设计适用于 4D 光场的适当扫描方法，以有效地对光场特征进行建模。为了解决这个问题，我们对 4D LFs 的信息性 2D 切片使用了 SSMs，以充分探索空间上下文信息、互补的角度信息和结构信息。为了实现这一点，我们精心设计了一个基本的 SSM 块，其特点是一个有效的 SS2D 机制，可以在这些 2D 切片上实现更有效和高效的特征学习。基于上述两个设计，我们进一步介绍了一种基于 SSM 的 LFSR 网络，称为 LFMamba。LF 基准测试的实验结果证明了 LFMamba 的卓越性能。此外，我们还进行了广泛的消融研究，以验证我们提出的方法的功效和泛化能力。我们希望我们的 LFMamba 能够为光场的有效表示学习提供启示。

Abstract

Recent years have witnessed significant advancements in light field image super-resolution (LFSR) owing to the progress of modern neural networks. However, these methods often face challenges in capturing long-range dependencies (CNN-based) or encounter quadratic computational complexities (Transformer-based), which limit their performance. Recently, the Sta

light field image super-resolution state space model selective scanning mechanism 2d slices of 4d lfs lfmamba

发现论文，激发创造

基于曼巴的高效子空间扫描的光场超分辨率

本文基于选择性状态空间模型 Mamba，提出了一种基于 Mamba 的光场超分辨率方法 MLFSR，通过设计高效的子空间扫描策略来实现对高分辨率 4D 光场的全图像处理，显著提升了性能。

Jun, 2024

频率辅助蟒蛇用于遥感图像超分辨率

提出了一种用于处理大规模远程感知图像超分辨率的频率辅助 Mamba 框架，通过多级融合结构和可学习的缩放适配器实现了准确的特征融合，相比于现有方法具有更高的峰值信噪比和更低的内存消耗和计算复杂度。

May, 2024

FusionMamba：基于状态空间模型的高效图像融合

图像融合是通过将具有有限光谱信息的高分辨率图像与具有丰富光谱数据的低分辨率图像相结合，生成高分辨率的多 / 高光谱图像。本文提出了一种名为 FusionMamba 的创新方法，通过在两个 U 型网络中结合 Mamba 块，以一种高效、独立和分级的方式提取空间和光谱特征，进而有效地将空间和光谱信息进行融合，得到了优于其他融合技术的性能，证明了 FusionMamba 的有效性。

Apr, 2024

RSMamba：基于状态空间模型的遥感图像分类

RSMamba 是基于状态空间模型（SSM）和 Mamba 的高效、硬件感知设计的一种远程感知图像分类的新型架构，它通过动态多路径激活机制增强了模型对非因果数据的建模能力，并在多个远程感知图像分类数据集上展现出卓越的性能，具有成为未来视觉基础模型骨干的潜力。

Mar, 2024

高效 VMamba：轻量级 Mamba 的孔隙选择扫描

基于轻量级模型开发的先前努力主要集中在 CNN 和 Transformer 基础设计上，但仍面临持久挑战。本研究受到 Mamba 等状态空间模型在语言建模和计算机视觉等多个任务中卓越表现和竞争力的启发，探索了视觉状态空间模型在轻量级模型设计中的潜力，并提出了一种新的高效模型变体 EfficientVMamba，通过有效的跳跃采样集成一种基于空洞的选择性扫描方法，构成旨在利用全局和局部表征特征的构件。此外，我们还调查了 SSM 模块与卷积之间的整合，并引入了一种高效的视觉状态空间块，结合了额外的卷积分支，进一步提高了模型的性能。实验结果表明，EfficientVMamba 降低了计算复杂性，同时在各种视觉任务中取得了有竞争力的结果。例如，我们的 EfficientVMamba-S 在 ImageNet 上对比 1.3G FLOPs 的 Vim-Ti 取得了大幅 5.6% 的准确率提升。代码可在以下链接找到: https://github.com/TerryPei/EfficientVMamba。

Mar, 2024

Mamba3D：基于状态空间模型增强 3D 点云分析的本地特征

通过引入局部几何特征提取机制和双向状态空间模型（bi-SSM），Mamba3D 模型在点云学习中取得了超过 Transformer 的卓越性能、高效性和可扩展性，在多个任务中超越同类模型和并行研究，包括在 ScanObjectNN 任务中从头开始的 92.6% 综合准确性和在 ModelNet40 分类任务中基于单模态预训练达到 95.1% 的准确性，并且具有线性复杂度。

Apr, 2024

多尺度 VMamba: 层次化视觉状态空间模型

通过分析多次扫描策略在多尺度视觉任务中的成功原因，本研究介绍了 Multi-Scale Vision Mamba（MSVMamba）模型，采用多尺度二维扫描技术并整合了卷积前馈网络（ConvFFN），在有限参数下保留了 State Space Models（SSMs）在视觉任务中的卓越性能。

May, 2024

VmambaIR：图像修复的视觉状态空间模型

我们提出了 VmambaIR，这是一种综合图像恢复任务的方法，它将线性复杂度的状态空间模型引入其中，通过有效地建模图像信息在各个方向上的流动来克服了状态空间模型的单向建模限制，并在图像去雨、单幅图像超分辨率和实际图像超分辨率等多个图像恢复任务上取得了最先进的性能。

Mar, 2024

MambaAD：用于多类无监督异常检测的状态空间模型研究

应用 Mamba 到多类无监督异常检测，提出了包含预训练编码器和 Mamba 解码器的 MambaAD，通过在多个尺度上引入局部增强状态空间模块 (LSS)，该方法在六个不同的异常检测数据集上展示了具有 SoTA 性能的结果，证实了其有效性。

Apr, 2024

计算效率时代：医学图像分析中状态空间模型的综合调查

该论文通过对 Mamba 模型在医学图像中的应用进行全面回顾，介绍了该模型的架构、分类和未来研究方向。

Jun, 2024