Apr, 2024

使用激活正则化减轻离群通道对于语言模型量化的影响

TL;DR准确的量化是语言模型的关键问题之一,我们研究了激活量化中的异常通道现象,并提出了一种调节输入和输出的策略,通过量化感知训练和激活峰度正则化来实现精确的 4 位参数量化。与权重后训练量化相结合,我们的方法可以获得与标准精度基准相竞争的 W4A4 模型。