Sep, 2024
深度神经网络加速器快速准确性能模型的自动生成
Automatic Generation of Fast and Accurate Performance Models for Deep
Neural Network Accelerators
Konstantin Lübeck, Alexander Louis-Ferdinand Jung, Felix Wedlich, Mika Markus Müller, Federico Nicolás Peccia...
TL;DR本研究针对在资源受限的边缘设备上实现深度神经网络(DNN)面临的挑战,提出了一种自动生成快速性能模型的方法,以准确估算映射到加速器架构的DNN延迟。我们的关键发现是,该方法结合DNN硬件依赖图分析,显著加速了性能评估过程,相较于仿真结果,有效降低了平均绝对百分比误差(MAPE)。