实时嵌入式对象检测基准测试框架

Apr, 2023

实时嵌入式对象检测基准测试框架

A Framework for Benchmarking Real-Time Embedded Object Detection

Michael Schlosser, Daniel König, Michael Teutsch

TL;DR本文提出了一种基于 MQTT 协议的轻量级接口框架，可用于测量目标检测性能、运行时间和能量效率，特别适用于限制硬件上的视频流应用，为优化 DNNs 提供深入的见解。

Abstract

object detection is one of the key tasks in many applications of computer vision. deep neural networks (DNNs) are undoubtedly a well-suited approach for →

object detection deep neural networks hardware-specific optimization message queuing telemetry transport energy efficiency

发现论文，激发创造

BED：一种针对边缘设备的实时物体检测系统

在 MAX78000DNN 加速器上，我们开发了适用于边缘设备的目标检测系统 (BED)，采用模型训练、量化、综合和部署的简明、有效和详细的解决方案，可以在 300 KB 微小的 DNN 模型下实现准确检测，仅需 91.9ms 的推理时间和 1.845mJ 的能量，并在实时 YouTube 上提供检测。

Feb, 2022

低功耗物体检测的系统级解决方案

本文提出了一种面向异构嵌入式设备的高效物体检测系统解决方案，其中包括量化网络和专门的加速器，并采用分组数据流策略将计算密集型的卷积操作映射到加速器中以提高效率。研究结果显示，在 512x512 输入大小的实际监控视频中，该系统的推理速度可以达到 18 FPS，功耗仅为 6.9W，并在 PASCAL VOC 2012 数据集上实现了 66.4 的 mAP。

Sep, 2019

多个领域实时物体检测网络的综合研究：调查

通过在多个实时检测器及数据集上进行综合研究，本研究对图像大小、置信阈值、架构层数等多种变量的影响进行了分析，研究了检测网络在分布偏移、自然破坏和对抗攻击等方面的鲁棒性，并提出了对 HTTP/3 实现的区分服务（DiffServ）传输的改进。

Aug, 2022

面向运行时优化的边缘人工智能设备深度神经网络目标检测部署

研究了两种不同的物体检测网络在嵌入式 AI 平台中的部署和运行环境，针对 TensorRT 和 TorchScript 两个库进行了 Runtime 和性能方面的对比分析，结果表明量化技术显著提高了部署效率而对检测性能的影响较小。

Aug, 2021

物联网设备的计算机视觉技术调查

通过本文，我们调查了低功耗和能效更高的深度神经网络实现的最新进展，其提高了深度神经网络的可部署性而在不显著牺牲准确性的情况下。这些技术可以分为三个主要类别：神经网络压缩、网络架构搜索和设计、以及编译器和图优化。我们调查了卷积和变换器深度神经网络的低功耗技术，并总结了其优点、缺点和研究中的问题。

Aug, 2023

提升物联网应用中轻量级神经网络对小物体检测的性能

基于现有对象检测器，本论文提出一种新颖的自适应平铺方法，可用于微控制器上，以提高小物体的检测效果，实验证明该方法可将 F1 得分提高 225％，同时将平均物体计数误差降低至 76％，此外，结果还表明使用软 F1 损失函数可以显著减少数据不平衡带来的负面影响，并通过在索尼 Spresense 微控制器上的实验证明了该方法在检测性能、低延迟和内存消耗之间实现平衡。

Nov, 2023

边缘辅助物体识别系统的基于测量的分析

本文提出了一种基于边缘计算的物体识别系统，研究了端到端延迟和物体识别准确性之间的系统级权衡，重点是优化系统的传输延迟，并证明了图像编码速率和神经网络大小对这两个性能指标的影响；通过测量实时物体识别应用程序的性能，探索最佳权衡点。测量结果显示了迄今未知的参数效应和明显的权衡，从而为优化这一关键服务铺平了道路。最后，使用基于测量的模型制定了两个优化问题，经过 Pareto 分析，发现系统操作的精心调整至少可在实时条件下获得比标准传输方法更高 33% 的性能。

Mar, 2020

LCDet: 用于嵌入式系统目标检测的低复杂度全卷积神经网络

本文提出了一种 LCDet 的全卷积神经网络，旨在用于嵌入式系统上的对象检测。作者设计并开发了一个端到端的 TensorFlow (TF) 模型，并采用 8 位量化技术。实验结果显示，该模型在保持准确率的同时，将模型大小和内存带宽分别减少了 3 倍和 4 倍，可以在嵌入式系统上实现。

May, 2017

一种差分测试框架用于评估图像识别模型的鲁棒性

本文提出了一种差分测试框架，该框架可对多种计算环境参数进行深度学习模型变量生成、执行、差分分析和测试，对三种热门图像识别模型使用 ImageNet 数据集进行鲁棒性分析，评估了更改深度学习框架、编译器优化和硬件设备的影响。

Jun, 2023

基于深度学习的目标检测综述

本调查研究了物体检测领域的主要发展现状以及现有典型检测模型的方法和评估数据集，分别分析了一阶段和二阶段检测器的综合概述，并总结了物体检测的传统和新型应用，最后就利用这些物体检测方法构建高效系统的应用建议和发展趋势进行了探讨。

Jul, 2019