MiM-ISTD:高效红外小目标检测中的蟒蛇嵌套
本文提出了一种用于红外小目标检测的扩散模型框架,通过模拟像素级判别与掩模后验分布建模相结合,转变了从判别范式到生成范式的方法,以绕过目标级的不敏感性,并设计了小波域中的低频隔离以抑制内在红外噪声对扩散噪声估计的干扰。实验证明,该方法在 NUAA-SIRST、IRSTD-1k 和 NUDT-SIRST 数据集上相对于最先进的方法具有竞争性的性能优势。
Mar, 2024
提出了一种基于改进的稠密嵌套注意力网络(IDNANet)的红外小目标检测方法,采用变压器架构并结合 Swine-transformer 进行特征提取,在稠密嵌套结构中引入 ACmix 注意力结构增强中间层特征,通过设计加权 Dice 二元交叉熵(WD-BCE)损失函数缓解前景 - 背景样本不平衡的负面影响。通过在公共数据集上的实验表明,该方法在检测概率(P_d)、误警率(F_a)和平均交集联合($mIoU$)等指标上优于其他最先进的方法,NUDT-SIRST 数据集上的 $mIoU$ 为 90.89,NUAA-SIRST 数据集上为 79.72。
Nov, 2023
通过基于曼巴的小波变换特征调制模型改进了红外图像超分辨率复原的上下文稀疏目标细节恢复,并证明了基于曼巴的模型在红外图像处理中的巨大潜力。
May, 2024
通过引入 Residual State Space Block 作为核心组件,该研究提出了一种名为 MambaIR 的简单而强大的基准模型,利用卷积和通道注意力增强了 vanilla Mamba 的能力,从而利用局部补丁的重复特性和通道交互产生特定于恢复的特征表示。广泛的实验证明了我们方法的优越性,例如,MambaIR 在类似计算成本但具有全局感受野的情况下,比基于 Transformer 的基准模型 SwinIR 提高了 0.36dB。
Feb, 2024
该研究提出了一种新的双加权多层次红外图像小目标检测模型,通过采集不重叠的图像块和使用张量分解来构建多层次红外图像小目标模型,利用自适应加权机制平衡不同粒度信息的重要性,并利用导向核提取局部结构信息,最终通过交替方向乘子法进行模型优化,实验结果表明该方法在不同场景下具有很好的鲁棒性和检测性能。
Oct, 2023
基于热传导理论原理,本论文提出热传导启发的变形器(TCI-Former)用于红外小目标检测(ISTD),通过特征图演化的角度描述 ISTD 过程,设计了热传导启发的注意力模块(TCIA)和热传导边界模块(TCBM),在 IRSTD-1k 和 NUAA-SIRST 数据集上的实验证明了方法的优越性。
Feb, 2024
提出了一种结合了 Mamba 和扩散模型的高效高分辨率图像合成方法 DiM,使用 ``weak-to-strong'' 训练策略和无需进一步微调的上采样策略提高训练和推理效率。
May, 2024
Diffusion Mamba (DiM) is a novel architecture that effectively addresses the computational complexity of traditional diffusion transformers (DiT) in image generation tasks while maintaining linear complexity with respect to sequence length, outperforming existing techniques and establishing a new benchmark for generative models.
May, 2024
提出了一个多尺度方向感知网络(MSDA-Net),首次尝试将红外小目标的高频方向特征作为领域先验知识集成到神经网络中,并通过创新的多方向特征感知(MDFA)模块、多尺度局部关联学习(MLRL)模块、高频方向注入(HFDI)模块等进行完整的特征提取和定位。大量实验结果表明,MSDA-Net 在公共数据集 NUDT-SIRST、SIRST 和 IRSTD-1k 上实现了最新的最佳效果。
Jun, 2024
利用创新的 Mamba-in-Mamba (MiM) 架构和利用 State Space Model (SSM) 的首次尝试,本研究提出了用于高光谱图像分类的 MiM 模型,通过改进的特征生成和集中方法以及改进的解码效率,优于现有基线和最先进方法,展示了其在高光谱应用中的效力和潜力。
May, 2024