BriefGPT.xyz
Ask
alpha
关键词
lossy coding length
搜索结果 - 1
后训练量化中的注意力轮
本研究提出了一种名为 Attention Round 的新型量化方法,利用密度函数实现了参数映射,使得小样本量即可完成量化加速,并通过损失编码长度对模型的不同层进行位宽分配来解决混合精度量化问题,该方法在不同模型上的实验结果表明具有良好的量
→
PDF
2 years ago
Prev
Next