Apr, 2016

卷积神经网络的硬件逼近

TL;DR本文提出Ristretto,一种模型逼近框架,可以使用固定点算术和表示来压缩卷积和全连接层的权重和输出,并且可以通过微调将结果定制到具体的硬件设备,成功地将CaffeNet和SqueezeNet压缩到8位。