Jul, 2020

HMQ: 用于卷积神经网络的硬件友好型混合精度量化块

TL;DR本文提出了 HMQ,一个基于 Gumbel-Softmax 估计器的混合精度量化块,搜索有限的量化方案空间,以覆盖在边缘设备硬件实现中需要的均匀和具有 2 的幂级别阈值的量化器需求,并在 CIFAR10 和 ImageNet 训练的分类模型上应用 HMQ,证明在一些情况下,虽然添加了限制,但也能够实现竞争性和最先进的结果。