BriefGPT.xyz
大模型
Ask
alpha
关键词
compression technologies
搜索结果 - 2
decoupleQ:通过将参数拆分为整数和浮点数实现 2-bit 后训练统一量化
通过解耦 Q,我们提出了一种量化方法,将模型参数分解为整数部分和浮点部分,使得量化问题转化为约束条件下的数学优化问题,并通过现成的优化方法解决。该方法在线上实现了接近 fp16/bf16 准确度的 2 位量化大型语音模型,在硬件上更友好且能
→
PDF
2 months ago
RdimKD: 通过降维进行通用蒸馏范式
这篇研究提出了一种新的知识蒸馏范式,称为维度降低知识蒸馏(RdimKD),通过使用一个投影矩阵将大网络和小网络的特征图投影到低维子空间,并在训练过程中进行优化,既保证学生从老师获取有价值信息,又灵活适应学生的低容量实际情况。实证研究表明 R
→
PDF
7 months ago
Prev
Next