AAAIMay, 2024

TinyM$^2$Net-V3: 面向可持续边缘部署的内存感知压缩多模态深度神经网络

TL;DR由于人工智能算法的普及和应用,能源使用和二氧化碳排放显著增加,加剧了对气候变化的担忧。为了解决这一问题,我们需要开发可持续的人工智能解决方案,特别是能耗低、适用于环境资源有限的嵌入式系统。本文介绍了 TinyM^2Net-V3,它是一个处理多模态数据的系统,设计了深度神经网络模型,并采用知识蒸馏和低位宽量化等模型压缩技术,以适应较低级别的内存层次,降低延迟,提高能源效率。我们通过 COVID-19 的咳嗽、语音和呼吸音频检测以及深度和热图像姿势分类两个多模态案例研究对 TinyM^2Net-V3 进行了评估,取得了 92.95% 和 90.7% 的准确率。我们的小型机器学习模型在资源有限的硬件上展示出低延迟和很高的功耗效率。