ICMLJun, 2021

混合精度和自适应分辨率的可微分动态量化

TL;DR我们提出了一种完全可微的方法,名为 differentiable dynamic quantization (DDQ),可用于学习模型量化中的所有超参数,通过实验表明 DDQ 在像 MobileNet 这样的轻量架构上表现最好,并且 DDQ 是硬件友好型。