Sep, 2024

在训练时优化多加速器SoC上的深度神经网络推理

TL;DR本研究解决了如何在多计算单元的异构系统上映射深度神经网络(DNN)的问题,以平衡推理的延迟和能耗,同时考虑到精度。提出的ODiMO工具在训练阶段有效探索DNN的细粒度映射,能够显著提高效率,实验结果表明,在同等精度下,ODiMO可将推理延迟减少最多8倍,并在能量效率方面实现高达50.8倍的改善。