Aug, 2023

面向高性能目标检测的研究:基于 ViT 和基于 CNN 的深度学习模型的无人机检测的洞察

TL;DR使用无人机数据集以及卷积神经网络(CNN)和视觉变换器(ViT)模型,本文重新评估了准确的无人机检测任务,表明基本的 ViT 模型在单一无人机检测方面的性能比最佳 CNN 迁移学习模型提升了 4.6 倍,并且通过多无人机检测实现了令人印象深刻的 98% 和 96% 的 mAP 值。作者总结了 ViT 和 CNN 模型的独特特点,以帮助未来研究者开发更高效的深度学习模型。