May, 2024

使用状态空间模型和可编程梯度的航空影像中小体目标检测的进展

TL;DR本文介绍了两种创新方法,显著提升了小型空中物体的检测和分割能力。首先,我们探索了SAHI框架在新引入的轻量级YOLO v9架构上的应用,利用可编程梯度信息(PGI)来减少在串行特征提取过程中常见的大量信息损失。同时,本文还采用了Vision Mamba模型,该模型结合位置嵌入以实现精确定位感知,结合了一种新颖的双向状态空间模型(SSM),用于有效的视觉背景建模。我们的实验结果显示,在不同的空中场景下,这些方法在检测准确度和处理效率上都取得了显著的改进,验证了这些方法在实时小型物体检测方面的适用性。本文还讨论了这些方法如何成为未来空中目标识别技术的基础模型。源代码将在此处提供。