MicroT: 微控制器的低能耗和自适应模型

Mar, 2024

MicroT: 微控制器的低能耗和自适应模型

MicroT: Low-Energy and Adaptive Models for MCUs

Yushan Huang, Ranya Aloufi, Xavier Cadet, Yuchen Zhao, Payam Barnaghi...

TL;DRMicroT 是一种低能耗的多任务自适应模型框架，适用于资源有限的微控制器。通过自我监督的知识蒸馏和模型的分离与联合训练，将原始模型分解为特征提取器和分类器，然后在微控制器上部署和训练这些模型，以执行关联推理和阶段决策，有效提高模型性能并减少能耗。

Abstract

We propose microt, a low-energy, multi-task adaptive model framework for resource-constrained →

microt low-energy multi-task adaptive model framework mcus energy consumption

发现论文，激发创造

面向资源受限的微控制器的机器学习和推断技术

本文提出了一种适用于微控制器单元 (MCUs) 的无电池 ML 推理和模型个性化管道，使用此管道在深海中进行了鱼类图像识别并比较其准确性，运行时长，功率和能源消耗等优劣，结果表明，在 MCUs 上可以实现 97.78％的精度，达到了无电池 ML 推理的可行性。

May, 2023

TensorFlow Lite Micro: 嵌入式 TinyML 系统上的机器学习

介绍了一个名为 TensorFlow Lite Micro (TF Micro) 的开源机器学习推理框架，它采用基于解释器的独特方法，旨在解决嵌入式系统资源限制和碎片化挑战等问题。此框架具有低资源需求和最小的运行时性能开销。

Oct, 2020

小型机器学习的高效神经网络：综述

深入分析了高效神经网络和深度学习模型在超低功耗微控制器上部署的细微机器学习（TinyML）应用的进展，并指出了未来的研究方向。

Nov, 2023

MicroNets: 用于在商用微控制器上部署 TinyML 应用的神经网络架构

本文介绍了机器学习在资源受限的微控制器上的应用，使用神经结构搜索算法来设计满足内存、延迟和能耗限制的模型，并通过可微分神经结构搜索算法搜索出了具有低内存使用和低操作计数的 MicroNet 模型，验证该文述方法在视觉唤醒词、音频关键词检测和异常检测等领域的优越性。

Oct, 2020

在低功耗 MCU 上优化微型 Transformer 的部署

本研究提出了一种在商业微控制器上对 Transformer 模型进行端到端部署的优化框架，通过优化库和新的推理调度方案，在多个 MCU 平台上实现了更低的延迟和能量消耗。

Apr, 2024

用快速重定向在微控制器上对 TinyML 进行基准测试

本文提出了一个名为 MLonMCU 的工具，通过在大量配置中自动化端到端基准测试流程并演示了 TFLite 和 TVM 等 TinyML 框架在微控制器上的无缝性能测试。

Jun, 2023

DiTMoS: 微控制器上多样化精简模型选择研究

改进 DiTMoS 的 DNN 训练和推断框架，通过构建小型 / 弱模型并改善其准确性，提高了深度神经网络在微控制器上的有效和准确的推断性能。

Mar, 2024

MCUFormer：在内存有限的微控制器上部署视觉 Transformer

本文提出了一种名为 MCUFormer 的硬件算法协同优化方法，用于在内存极为有限的微控制器上部署视觉变换器，实现图像分类任务，通过考虑降维尺寸和补丁分辨率来扩展视觉变换器的搜索空间，并通过操作符集成、补丁嵌入分解和令牌覆写等方法来构建视觉变换器的推理操作库，实验结果表明 MCUFormer 在 STM32F746 微控制器上实现了 320KB 内存的 ImageNet 图像分类任务的 73.62％的 Top-1 准确率。

Oct, 2023

边缘实时视觉处理的超低功耗 TinyML 系统

通过在芯片上存储全部功能和权重，完全消除了离线内存访问的延迟和能耗，并提出了一种应用特定的指令集，以实现敏捷开发和快速部署。实验表明，基于该模型、NCP 和指令集的 TinyML 系统在实现物体检测和识别时，取得了可观的准确度，并实现了纪录级的超低功耗，只有 160mW。

Jul, 2022

微型机器学习：进展与前景

Tiny Machine Learning （TinyML）是机器学习的新领域。通过将深度学习模型应用于无数物联网设备和微控制器（MCU），我们扩大了人工智能应用的范围并实现了无处不在的智能。然而，由于硬件限制，TinyML 具有一定挑战性，因为内存资源有限，难以容纳为云和移动平台设计的深度学习模型；同时，裸机设备对编译器和推理引擎的支持有限。因此，我们需要对算法和系统栈进行共同设计，以实现 TinyML。在此综述中，我们首先讨论 TinyML 的定义、挑战和应用；接下来，我们调查了最近在 MCUs 上 TinyML 和深度学习的进展；然后，我们介绍了 MCUNet，展示了如何通过系统 - 算法共同设计，在物联网设备上实现 ImageNet 规模的人工智能应用；我们还将解决方案从推理扩展到训练，并介绍了小型设备上的训练技术；最后，我们展示了这个领域的未来发展方向。今天的大型模型可能成为明天的小型模型，TinyML 的范围应该随着时间的推移而不断发展和适应。

Mar, 2024