Mar, 2024

MiM-ISTD:高效红外小目标检测中的蟒蛇嵌套

TL;DR通过将卷积网络与 Transformer 相结合的结构,本文探索了一种用于高效红外小目标检测的 Mamba-in-Mamba 结构,该结构通过对局部块进行子块分解,利用每个子块之间的相互作用来大大提升 MiM-ISTD 的表征能力和计算效率。实验证明,MiM-ISTD 方法的准确性和效率均优于现有方法,其推理速度比 SOTA 快 10 倍,并且在推理过程中减少了 73.4% 的 GPU 内存使用量,克服了在高分辨率红外图像上执行基于 Mamba 的理解时的计算和内存限制。