实时嵌入式对象检测基准测试框架
在 MAX78000DNN 加速器上,我们开发了适用于边缘设备的目标检测系统 (BED),采用模型训练、量化、综合和部署的简明、有效和详细的解决方案,可以在 300 KB 微小的 DNN 模型下实现准确检测,仅需 91.9ms 的推理时间和 1.845mJ 的能量,并在实时 YouTube 上提供检测。
Feb, 2022
本文提出了一种面向异构嵌入式设备的高效物体检测系统解决方案,其中包括量化网络和专门的加速器,并采用分组数据流策略将计算密集型的卷积操作映射到加速器中以提高效率。研究结果显示,在 512x512 输入大小的实际监控视频中,该系统的推理速度可以达到 18 FPS,功耗仅为 6.9W,并在 PASCAL VOC 2012 数据集上实现了 66.4 的 mAP。
Sep, 2019
通过在多个实时检测器及数据集上进行综合研究,本研究对图像大小、置信阈值、架构层数等多种变量的影响进行了分析,研究了检测网络在分布偏移、自然破坏和对抗攻击等方面的鲁棒性,并提出了对 HTTP/3 实现的区分服务(DiffServ)传输的改进。
Aug, 2022
研究了两种不同的物体检测网络在嵌入式 AI 平台中的部署和运行环境,针对 TensorRT 和 TorchScript 两个库进行了 Runtime 和性能方面的对比分析,结果表明量化技术显著提高了部署效率而对检测性能的影响较小。
Aug, 2021
通过本文,我们调查了低功耗和能效更高的深度神经网络实现的最新进展,其提高了深度神经网络的可部署性而在不显著牺牲准确性的情况下。这些技术可以分为三个主要类别:神经网络压缩、网络架构搜索和设计、以及编译器和图优化。我们调查了卷积和变换器深度神经网络的低功耗技术,并总结了其优点、缺点和研究中的问题。
Aug, 2023
基于现有对象检测器,本论文提出一种新颖的自适应平铺方法,可用于微控制器上,以提高小物体的检测效果,实验证明该方法可将 F1 得分提高 225%,同时将平均物体计数误差降低至 76%,此外,结果还表明使用软 F1 损失函数可以显著减少数据不平衡带来的负面影响,并通过在索尼 Spresense 微控制器上的实验证明了该方法在检测性能、低延迟和内存消耗之间实现平衡。
Nov, 2023
本文提出了一种基于边缘计算的物体识别系统,研究了端到端延迟和物体识别准确性之间的系统级权衡,重点是优化系统的传输延迟,并证明了图像编码速率和神经网络大小对这两个性能指标的影响;通过测量实时物体识别应用程序的性能,探索最佳权衡点。测量结果显示了迄今未知的参数效应和明显的权衡,从而为优化这一关键服务铺平了道路。最后,使用基于测量的模型制定了两个优化问题,经过 Pareto 分析,发现系统操作的精心调整至少可在实时条件下获得比标准传输方法更高 33% 的性能。
Mar, 2020
本文提出了一种 LCDet 的全卷积神经网络,旨在用于嵌入式系统上的对象检测。作者设计并开发了一个端到端的 TensorFlow (TF) 模型,并采用 8 位量化技术。实验结果显示,该模型在保持准确率的同时,将模型大小和内存带宽分别减少了 3 倍和 4 倍,可以在嵌入式系统上实现。
May, 2017
本文提出了一种差分测试框架,该框架可对多种计算环境参数进行深度学习模型变量生成、执行、差分分析和测试,对三种热门图像识别模型使用 ImageNet 数据集进行鲁棒性分析,评估了更改深度学习框架、编译器优化和硬件设备的影响。
Jun, 2023
本调查研究了物体检测领域的主要发展现状以及现有典型检测模型的方法和评估数据集,分别分析了一阶段和二阶段检测器的综合概述,并总结了物体检测的传统和新型应用,最后就利用这些物体检测方法构建高效系统的应用建议和发展趋势进行了探讨。
Jul, 2019