Jun, 2023

面向 DNN 推理的多加速器平台的精度感知延迟和能耗平衡

TL;DR该研究提出 ODiMO,是一种硬件感知工具,用于精细映射芯片上的不同加速器,以并行执行 DNN 的不同层,从而降低推理能量消耗或延迟。在三个流行的数据集 / DNN 对上追求在精度与能量或延迟空间中 Pareto 最优网络,在 DIANA 异构超低功耗边缘 AI SoC 上部署后,ODiMO 将能量 / 延迟降低了 33%/31%,而精度下降有限(-0.53%/-0.32%),与手动启发式映射相比。