May, 2024
AdpQ:一种无需校准自适应后训练量化方法
AdpQ: A Zero-shot Calibration Free Adaptive Post Training Quantization
Method for LLMs
TL;DR本研究提出了一种名为AdpQ的零样本自适应PTQ方法,通过采用自适应软阈值方法分离显著权重,实现低精度量化(如3位)中无需任何校准数据的最先进性能,进一步提供隐私保护优势,而且在各种LLM基准测试中达到与现有方法相同的准确性,即使量化时间缩短至少10倍。