ICMLJun, 2022

SDQ:带混合精度的随机可微量化

TL;DR本文提出了一种新的随机可微量化(SDQ)方法,利用不同层和模块的优化比特宽度来自动学习混合精度量化策略,并利用熵感知的分 bin 正则化和知识蒸馏对网络进行训练,经过在不同硬件和数据集上广泛的评估,SDQ 在较低的比特宽度下优于所有最先进的混合或单精度量化,甚至优于各种 ResNet 和 MobileNet 家族的全精度对应物,展示了我们的方法的有效性和优越性。