May, 2020

BiQGEMM:二进制编码量化深度神经网络中的查找表矩阵乘法

TL;DR本论文提出了一种针对量化 DNN(deep neural networks)的新型矩阵乘法方法,称为 BiQGEMM。通过一次指令同时访问多个量化权重, BiQGEMM 可以提高计算性能,并通过预计算中间结果来降低计算总量。在大量实验中,BiQGEMM 在 DNN 量化场景下表现出更高的性能。