Nov, 2017

最小能量量化神经网络

TL;DR本研究针对量化神经网络(QNNs)的最小能量自动优化进行了探索和分析,发现在相同准确性的情况下,使用更少的位数的 QNNs 需要更深和更宽的网络架构,但需要较简单的算术和较少的权重位数。经过模拟推导,二进制网络或 int4 实施可以实现最小能量解,比在准确性上相同的情况下,int8 网络快 2-10 倍。