MiM-ISTD：高效红外小目标检测中的蟒蛇嵌套

Mar, 2024

MiM-ISTD：高效红外小目标检测中的蟒蛇嵌套

MiM-ISTD: Mamba-in-Mamba for Efficient Infrared Small Target Detection

Tianxiang Chen, Zhentao Tan, Tao Gong, Qi Chu, Yue Wu...

TL;DR通过将卷积网络与 Transformer 相结合的结构，本文探索了一种用于高效红外小目标检测的 Mamba-in-Mamba 结构，该结构通过对局部块进行子块分解，利用每个子块之间的相互作用来大大提升 MiM-ISTD 的表征能力和计算效率。实验证明，MiM-ISTD 方法的准确性和效率均优于现有方法，其推理速度比 SOTA 快 10 倍，并且在推理过程中减少了 73.4% 的 GPU 内存使用量，克服了在高分辨率红外图像上执行基于 Mamba 的理解时的计算和内存限制。

Abstract

Thanks to the development of basic models, infrared small target detection (ISTD) algorithms have made significant progress. Specifically, the structures combining convolutional networks with →

infrared small target detection convolutional networks transformers mamba-in-mamba efficiency

发现论文，激发创造

通过后验分布建模减轻红外小目标检测的目标级不敏感性

本文提出了一种用于红外小目标检测的扩散模型框架，通过模拟像素级判别与掩模后验分布建模相结合，转变了从判别范式到生成范式的方法，以绕过目标级的不敏感性，并设计了小波域中的低频隔离以抑制内在红外噪声对扩散噪声估计的干扰。实验证明，该方法在 NUAA-SIRST、IRSTD-1k 和 NUDT-SIRST 数据集上相对于最先进的方法具有竞争性的性能优势。

Mar, 2024

基于 Transformer 的改进密集嵌套注意力网络用于红外小目标检测

提出了一种基于改进的稠密嵌套注意力网络（IDNANet）的红外小目标检测方法，采用变压器架构并结合 Swine-transformer 进行特征提取，在稠密嵌套结构中引入 ACmix 注意力结构增强中间层特征，通过设计加权 Dice 二元交叉熵（WD-BCE）损失函数缓解前景 - 背景样本不平衡的负面影响。通过在公共数据集上的实验表明，该方法在检测概率（P_d）、误警率（F_a）和平均交集联合（$mIoU$）等指标上优于其他最先进的方法，NUDT-SIRST 数据集上的 $mIoU$ 为 90.89，NUAA-SIRST 数据集上为 79.72。

Nov, 2023

IRSRMamba: 基于 Mamba 的小波变换特征调制模型的红外图像超分辨率

通过基于曼巴的小波变换特征调制模型改进了红外图像超分辨率复原的上下文稀疏目标细节恢复，并证明了基于曼巴的模型在红外图像处理中的巨大潜力。

May, 2024

MambaIR：一种基于状态空间模型的简单图像恢复基准方法

通过引入 Residual State Space Block 作为核心组件，该研究提出了一种名为 MambaIR 的简单而强大的基准模型，利用卷积和通道注意力增强了 vanilla Mamba 的能力，从而利用局部补丁的重复特性和通道交互产生特定于恢复的特征表示。广泛的实验证明了我们方法的优越性，例如，MambaIR 在类似计算成本但具有全局感受野的情况下，比基于 Transformer 的基准模型 SwinIR 提高了 0.36dB。

Feb, 2024

利用双重加权多粒度补丁张量模型和张量列车分解进行红外小目标检测

该研究提出了一种新的双加权多层次红外图像小目标检测模型，通过采集不重叠的图像块和使用张量分解来构建多层次红外图像小目标模型，利用自适应加权机制平衡不同粒度信息的重要性，并利用导向核提取局部结构信息，最终通过交替方向乘子法进行模型优化，实验结果表明该方法在不同场景下具有很好的鲁棒性和检测性能。

Oct, 2023

TCI-Former: 红外小目标探测的热传导启发式 Transformer

基于热传导理论原理，本论文提出热传导启发的变形器（TCI-Former）用于红外小目标检测（ISTD），通过特征图演化的角度描述 ISTD 过程，设计了热传导启发的注意力模块（TCIA）和热传导边界模块（TCBM），在 IRSTD-1k 和 NUAA-SIRST 数据集上的实验证明了方法的优越性。

Feb, 2024

DiM: 高效高分辨率图像合成的扩散灰曼巴

提出了一种结合了 Mamba 和扩散模型的高效高分辨率图像合成方法 DiM，使用 ``weak-to-strong'' 训练策略和无需进一步微调的上采样策略提高训练和推理效率。

May, 2024

使用双向 SSM 扩展 Diffusion Mamba 以实现高效图像和视频生成

Diffusion Mamba (DiM) is a novel architecture that effectively addresses the computational complexity of traditional diffusion transformers (DiT) in image generation tasks while maintaining linear complexity with respect to sequence length, outperforming existing techniques and establishing a new benchmark for generative models.

May, 2024

多尺度方向感知网络用于红外小目标检测

提出了一个多尺度方向感知网络（MSDA-Net），首次尝试将红外小目标的高频方向特征作为领域先验知识集成到神经网络中，并通过创新的多方向特征感知（MDFA）模块、多尺度局部关联学习（MLRL）模块、高频方向注入（HFDI）模块等进行完整的特征提取和定位。大量实验结果表明，MSDA-Net 在公共数据集 NUDT-SIRST、SIRST 和 IRSTD-1k 上实现了最新的最佳效果。

Jun, 2024

基于令牌化的马巴模型中的中央化马巴交叉扫描用于高光谱图像分类

利用创新的 Mamba-in-Mamba (MiM) 架构和利用 State Space Model (SSM) 的首次尝试，本研究提出了用于高光谱图像分类的 MiM 模型，通过改进的特征生成和集中方法以及改进的解码效率，优于现有基线和最先进方法，展示了其在高光谱应用中的效力和潜力。

May, 2024