Nov, 2024
ASER:用于大型语言模型量化的激活平滑与误差重建
ASER: Activation Smoothing and Error Reconstruction for Large Language
Model Quantization
TL;DR本研究解决了大型语言模型(LLM)量化中有效低位量化的挑战,提出了一种新颖的ASER算法,通过强化量化后的误差重建和激活平滑来改善模型性能。实验结果表明,ASER在保持准确性的同时,能够将典型的LLM量化为低位模型,并在最先进的量化算法中表现出竞争力。