You Only Look Once: 统一、实时目标检测
这篇论文介绍了一种实时目标检测系统YOLO9000,能够检测超过9000个物体类别,该系统基于改进的YOLO检测方法,结合了机器学习和COCO数据集进行训练,实现了同时进行目标检测和分类的功能。
Dec, 2016
本文提出了一种名为Fast YOLO的新框架,通过深度智能进化框架优化了YOLOv2网络架构并将运动自适应推理方法引入,从而在保持性能的同时,在嵌入式设备上实现实时物体检测。实验结果表明,Fast YOLO框架可以在平均3.3倍的速度加速下,将嵌入式系统上的检测性能提高到18FPS。
Sep, 2017
本技术报告介绍了YOLOv6的开发和部署,该模型包括最新的网络设计、训练策略、测试技术、量化和优化方法,可适用于不同规模的应用场景,并在各种硬件平台上表现出色。
Sep, 2022
本文综合分析了YOLO实时目标检测系统的发展历程及其每个版本的创新和贡献,从原版YOLO到YOLOv8,涵盖了标准度量和后处理、网络架构和训练技巧等方面,总结了YOLO发展的重要经验和展望其未来,强调提高实时目标检测系统的潜在研究方向。
Apr, 2023
通过在4个不同的数据集和4个不同的嵌入式硬件平台(x86 CPU,ARM CPU,Nvidia GPU,NPU)上进行公平、可控的比较,收集了550多个基于YOLO的目标检测模型的准确性和延迟数据,并通过帕累托优化分析表明,基于YOLO系列的多种架构都可在准确性和延迟之间取得良好的平衡,包括YOLOv3和YOLOv4等旧模型。在YOLOBench上评估了神经架构搜索中的无成本准确性估计器,并证明虽然大多数最先进的零成本准确性估计器被简单的基准(如MAC计数)超越,但其中一些可以有效地用于预测帕累托最优的检测模型。通过在树莓派4 CPU上使用零成本代理,展示了一种与最先进的YOLOv8模型具有竞争力的YOLO架构。
Jul, 2023
提供高效且表现良好的目标检测器YOLO-MS, 基于对不同核大小的卷积如何影响不同尺度物体的检测性能进行一系列研究来实现。新的策略能够大大增强实时目标检测器的多尺度特征表示。在MS COCO数据集上训练的YOLO-MS, 不依赖于其他大规模数据集或预训练权重, 在相同参数和FLOPs数量下, 优于最近的实时目标检测器,包括YOLO-v7和RTMDet。
Aug, 2023
YOLO-World is an innovative approach that enhances the You Only Look Once (YOLO) series of detectors with open-vocabulary detection capabilities through vision-language modeling, achieving high efficiency and accuracy in detecting a wide range of objects in a zero-shot manner.
Jan, 2024
通过消除非极大值抑制(NMS)的依赖性和综合优化YOLOs的各个组件,本研究提出了一种新一代的实时端到端目标检测模型YOLOv10,其在性能和效率方面均取得了最新的成果。
May, 2024
基于 State Space Models 的 Mamba-YOLO 目标检测模型通过优化 SSM 和引入 LSBlock 和 RGBlock 模块,在 COCO 和 VOC 数据集上实验证明,其在性能和竞争力方面均超过了现有的 YOLO 系列模型,展示了其巨大的潜力和竞争优势。
Jun, 2024
本研究针对现有模型在图像对象识别与定位中忽视全数据集信息的局限性,提出了一种创新的检索字典(RD)模块。该模块允许YOLO模型高效检索包含数据集见解的特征,从而显著提升多个任务的性能,如分割、检测和分类,实验结果显示平均精准度提升超过3%。
Oct, 2024