Jul, 2023

通过使用右截尾高斯噪声进行训练,提升 NVCiM DNN 加速器的实际最差情况性能

TL;DR使用非易失性存储器构建的计算内存(CiM)在加速深度神经网络(DNNs)方面具有潜力,但由于设备变异,训练有素的模型参数在映射到 NVM 设备后常常出现较大偏差,导致这些基于 CiM 的 DNN 加速器性能显著下降。本文提出使用 k-th 百分位性能(KPP)来捕捉 CiM 加速器上 DNN 模型实际最坏情况的性能,通过对 KPP 和基于噪声注入的 DNN 训练性质进行形式化分析,我们证明注入新的右修剪高斯噪声,相比传统高斯噪声,显著改善了 DNN 的 KPP。同时,我们还提出了一种自动确定训练过程中注入这种右修剪高斯噪声的最佳超参数的方法。与增强 DNN 鲁棒性方法相比,我们的方法在 KPP 上改进了最高达 26%的性能。