Jan, 2024

基于定点计算阵列的 DNN 加速器激活错误可靠性探索

TL;DR本文提出了一种全面的方法,用于探索和评估量化对模型准确性、激活故障可靠性和硬件效率的三方面影响。通过各种量化感知技术、故障注入和硬件实现,实现了全自动化的框架,并提出了一种轻量级保护技术,以确保最终基于系统阵列的 FPGA 实现的可靠部署。实验结果表明,量化对可靠性、硬件性能和网络准确性具有重要影响,特别是网络激活中的瞬态故障方面。