Jul, 2020

HMQ: 用于卷积神经网络的硬件友好型混合精度量化块

TL;DR本文提出了HMQ,一个基于Gumbel-Softmax估计器的混合精度量化块,搜索有限的量化方案空间,以覆盖在边缘设备硬件实现中需要的均匀和具有2的幂级别阈值的量化器需求,并在CIFAR10和ImageNet训练的分类模型上应用HMQ,证明在一些情况下,虽然添加了限制,但也能够实现竞争性和最先进的结果。