BriefGPT.xyz
大模型
Ask
alpha
关键词
quantization performance
搜索结果 - 2
EasyQuant: 一种高效无数据量化算法用于 LLMs
本研究提出了 EasyQuant,这是一种训练免费且独立于数据的权重量化算法,旨在实现对大型语言模型(LLMs)的几乎无损量化性能,且算法运行速度比依赖于数据的方法快 10 倍以上。
PDF
4 months ago
ACQ: 通过关注力校正来提高生成式无数据量化
该论文提出了 ACQ 方法,通过注意力中心位置条件发生器和对手损失等技术,解决了数据合成过程中 attention 分布不均和同一类别合成样本之间注意力过于相似的问题,以提升量化算法的性能。在对 Resnet18 和 Resnet50 进行
→
PDF
a year ago
Prev
Next