TinyissimoYOLO: 一种量化、低内存占用、适用于低功耗微控制器的小型机器学习目标检测网络
本文介绍了一种超轻量级物体检测网络 TinyissimoYOLO,旨在为功耗为几毫瓦的边缘系统提供高度灵活且完全量化的解决方案,实验结果表明,该模型在不同参数下都表现出较好的性能,并且在多种超低功耗平台上展现出更高的能效和更低的推理延迟。
Jul, 2023
本文提出了一种基于深度卷积神经网络的实时嵌入式物体检测算法 Tiny SSD,通过高度优化的非均匀 Fire 子网堆栈和高度优化的非均匀 SSD 辅助卷积特征层,将模型大小控制在 2.3MB (~ 比 Tiny YOLO 小 26 倍) 的情况下,仍然能够在 VOC 2007 上实现 61.3%(比 Tiny YOLO 高 4.2%)的 mean average precision (mAP),结果表明可以为嵌入式场景设计非常小的深度神经网络体系结构以进行实时物体检测。
Feb, 2018
本文说明了在智能眼镜中设计和实现利用新型低功耗处理器的小型机器学习算法,以实现持续不间断运行。我们使用两个微控制器和蓝牙低功耗模块为研究平台设计了智能眼镜原型,集成了用于能耗和延迟评估的基于 YOLO 的小型深度学习模型 TinyissimoYOLO,并在原型上进行了评估,结果表明其具有良好的检测精度和能耗性能。
Nov, 2023
基于现有对象检测器,本论文提出一种新颖的自适应平铺方法,可用于微控制器上,以提高小物体的检测效果,实验证明该方法可将 F1 得分提高 225%,同时将平均物体计数误差降低至 76%,此外,结果还表明使用软 F1 损失函数可以显著减少数据不平衡带来的负面影响,并通过在索尼 Spresense 微控制器上的实验证明了该方法在检测性能、低延迟和内存消耗之间实现平衡。
Nov, 2023
本研究描述了一种低位量化方法来构建一个高效的单级检测器,称为 Q-YOLO,有利于在资源受限的边缘设备上部署目标检测模型,从而实现减少计算和内存开销的实时检测。
Jul, 2023
本文提出了一种 LCDet 的全卷积神经网络,旨在用于嵌入式系统上的对象检测。作者设计并开发了一个端到端的 TensorFlow (TF) 模型,并采用 8 位量化技术。实验结果显示,该模型在保持准确率的同时,将模型大小和内存带宽分别减少了 3 倍和 4 倍,可以在嵌入式系统上实现。
May, 2017
本文提出了一种面向异构嵌入式设备的高效物体检测系统解决方案,其中包括量化网络和专门的加速器,并采用分组数据流策略将计算密集型的卷积操作映射到加速器中以提高效率。研究结果显示,在 512x512 输入大小的实际监控视频中,该系统的推理速度可以达到 18 FPS,功耗仅为 6.9W,并在 PASCAL VOC 2012 数据集上实现了 66.4 的 mAP。
Sep, 2019
通过在芯片上存储全部功能和权重,完全消除了离线内存访问的延迟和能耗,并提出了一种应用特定的指令集,以实现敏捷开发和快速部署。实验表明,基于该模型、NCP 和指令集的 TinyML 系统在实现物体检测和识别时,取得了可观的准确度,并实现了纪录级的超低功耗,只有 160mW。
Jul, 2022
我们在本文中提出了 YOLO-TLA,这是一种基于 YOLOv5 的先进物体检测模型,通过在颈部网络金字塔架构中引入一个额外的检测层来检测小对象,从而提供一个更大尺度的特征图以辨别小对象的更细致特征,并将 C3CrossCovn 模块集成到骨干网络中,有效地减少计算需求和参数数量,使模型更加紧凑
Feb, 2024
本文提出了一种名为 Fast YOLO 的新框架,通过深度智能进化框架优化了 YOLOv2 网络架构并将运动自适应推理方法引入,从而在保持性能的同时,在嵌入式设备上实现实时物体检测。实验结果表明,Fast YOLO 框架可以在平均 3.3 倍的速度加速下,将嵌入式系统上的检测性能提高到 18FPS。
Sep, 2017