May, 2024

vMCU: MCU 上的 DNN 推理的协调内存管理和内核优化

TL;DR基于微控制器单元(MCU)的物联网设备为近传感器深度学习模型(DNN)提供超低功耗和无处不在的计算能力。本文提出了一种协同 MCU 上的 DNN 推断的内存管理和内核优化方法,以实现细粒度的内存管理。通过将有限内存虚拟化为一个大型内存池,每个内核将内存池划分为内核特定的段,并在计算 DNN 层时处理段的加载和存储,从而减少内存消耗。实验结果表明,相较于现有技术,所提方法在 MCU 上可以降低 RAM 使用量 12.0% 至 49.5%,能量消耗 20.6% 至 53.0%,对于完整的 DNN 评估,内存瓶颈可以降低 61.5%,从而使更多的模型能够部署在低端 MCU 上。