Aug, 2024
OVA-DETR:基于图像-文本对齐和融合的开放词汇空中目标检测
OVA-DETR: Open Vocabulary Aerial Object Detection Using Image-Text
Alignment and Fusion
TL;DR本研究解决了现有空中目标检测方法仅能处理预定义类别的问题,通过引入图像与文本之间的关系,提出了高效的开放词汇检测器OVA-DETR。该方法通过区域-文本对比损失替代传统检测框架中的类别回归损失,从而打破类别限制,显著提高了小物体检测能力和推断速度,实验结果表明其在多个基准数据集上有显著提升。