MicroT: 微控制器的低能耗和自适应模型
本文提出了一种适用于微控制器单元 (MCUs) 的无电池 ML 推理和模型个性化管道,使用此管道在深海中进行了鱼类图像识别并比较其准确性,运行时长,功率和能源消耗等优劣,结果表明,在 MCUs 上可以实现 97.78%的精度,达到了无电池 ML 推理的可行性。
May, 2023
介绍了一个名为 TensorFlow Lite Micro (TF Micro) 的开源机器学习推理框架,它采用基于解释器的独特方法,旨在解决嵌入式系统资源限制和碎片化挑战等问题。此框架具有低资源需求和最小的运行时性能开销。
Oct, 2020
本文介绍了机器学习在资源受限的微控制器上的应用,使用神经结构搜索算法来设计满足内存、延迟和能耗限制的模型,并通过可微分神经结构搜索算法搜索出了具有低内存使用和低操作计数的 MicroNet 模型,验证该文述方法在视觉唤醒词、音频关键词检测和异常检测等领域的优越性。
Oct, 2020
本研究提出了一种在商业微控制器上对 Transformer 模型进行端到端部署的优化框架,通过优化库和新的推理调度方案,在多个 MCU 平台上实现了更低的延迟和能量消耗。
Apr, 2024
本文提出了一个名为 MLonMCU 的工具,通过在大量配置中自动化端到端基准测试流程并演示了 TFLite 和 TVM 等 TinyML 框架在微控制器上的无缝性能测试。
Jun, 2023
改进 DiTMoS 的 DNN 训练和推断框架,通过构建小型 / 弱模型并改善其准确性,提高了深度神经网络在微控制器上的有效和准确的推断性能。
Mar, 2024
本文提出了一种名为 MCUFormer 的硬件算法协同优化方法,用于在内存极为有限的微控制器上部署视觉变换器,实现图像分类任务,通过考虑降维尺寸和补丁分辨率来扩展视觉变换器的搜索空间,并通过操作符集成、补丁嵌入分解和令牌覆写等方法来构建视觉变换器的推理操作库,实验结果表明 MCUFormer 在 STM32F746 微控制器上实现了 320KB 内存的 ImageNet 图像分类任务的 73.62%的 Top-1 准确率。
Oct, 2023
通过在芯片上存储全部功能和权重,完全消除了离线内存访问的延迟和能耗,并提出了一种应用特定的指令集,以实现敏捷开发和快速部署。实验表明,基于该模型、NCP 和指令集的 TinyML 系统在实现物体检测和识别时,取得了可观的准确度,并实现了纪录级的超低功耗,只有 160mW。
Jul, 2022
Tiny Machine Learning (TinyML)是机器学习的新领域。通过将深度学习模型应用于无数物联网设备和微控制器(MCU),我们扩大了人工智能应用的范围并实现了无处不在的智能。然而,由于硬件限制,TinyML 具有一定挑战性,因为内存资源有限,难以容纳为云和移动平台设计的深度学习模型;同时,裸机设备对编译器和推理引擎的支持有限。因此,我们需要对算法和系统栈进行共同设计,以实现 TinyML。在此综述中,我们首先讨论 TinyML 的定义、挑战和应用;接下来,我们调查了最近在 MCUs 上 TinyML 和深度学习的进展;然后,我们介绍了 MCUNet,展示了如何通过系统 - 算法共同设计,在物联网设备上实现 ImageNet 规模的人工智能应用;我们还将解决方案从推理扩展到训练,并介绍了小型设备上的训练技术;最后,我们展示了这个领域的未来发展方向。今天的大型模型可能成为明天的小型模型,TinyML 的范围应该随着时间的推移而不断发展和适应。
Mar, 2024