Jul, 2022

后训练量化中的注意力轮

TL;DR本研究提出了一种名为 Attention Round 的新型量化方法,利用密度函数实现了参数映射,使得小样本量即可完成量化加速,并通过损失编码长度对模型的不同层进行位宽分配来解决混合精度量化问题,该方法在不同模型上的实验结果表明具有良好的量化性能及实用性。