Sep, 2018
为高效嵌入式推断发现接近全精度网络的低精度网络
Discovering Low-Precision Networks Close to Full-Precision Networks for Efficient Embedded Inference
Jeffrey L. McKinstry, Steven K. Esser, Rathinakumar Appuswamy, Deepika Bablani, John V. Arthur...
TL;DR通过调整激活函数范围并使用精细调整的预训练模型来组合简单技术,可以发现与 fp32 模型接近的低精度模型,同时提高了效率,本文证明了 4 位精度足以进行分类。