Mar, 2022

通过学习每层重要性进行混合精度神经网络量化

TL;DR该研究提出利用量化器中的可学习参数作为量化精度重要指标,通过一次整数线性规划来确定混合精度量化的最佳位宽以提高时间效率,并在多种模型中实现了 SOTA 精度。