Jun, 2023
DNA-TEQ:用于 DNN 推导的自适应指数张量量化
DNA-TEQ: An Adaptive Exponential Quantization of Tensors for DNN Inference
Bahareh Khabbazan, Marc Riera, Antonio González
TL;DR本篇论文提出了 DNA-TEQ,一种指数量化深度神经网络张量的方法,其通过在指数域中执行点积运算,在不需要重新训练神经网络的情况下,将平均量化比基线低 40%,同时具有可忽略的精度损失和节约 66%的能量消耗的优势。