BriefGPT.xyz
大模型
Ask
alpha
关键词
mixed-precision models
搜索结果 - 1
基于低成本代理的混合精度自适应量化
该论文提出了一种名为 LCPAQ 的新型模型量化方法,其中包含三个关键模块。在考虑硬件限制的基础上设计了硬件感知模块,开发了自适应混合精度量化模块来评估量化灵敏度,并使用希狄矩阵和 Pareto 边界技术进行整数线性规划来微调不同层的量化。
→
PDF
4 months ago
Prev
Next