May, 2024

AdpQ:一种无需校准自适应后训练量化方法

TL;DR本研究提出了一种名为 AdpQ 的零样本自适应 PTQ 方法,通过采用自适应软阈值方法分离显著权重,实现低精度量化(如 3 位)中无需任何校准数据的最先进性能,进一步提供隐私保护优势,而且在各种 LLM 基准测试中达到与现有方法相同的准确性,即使量化时间缩短至少 10 倍。