Sep, 2020

FleXOR: 可训练分数量化

TL;DR本文提出了一种基于加密算法 / 架构的量化压缩方法,通过加入 XOR 门并利用反向传播进行梯度计算,实现了每个权重有小数位的量化比特数,并可用于深度神经网络,结果表明相比二进制神经网络,该方法能够在模型准确性和模型尺寸上达到更好的平衡。