Feb, 2024

L4Q:大型语言模型的参数高效量化感知训练:基于 LoRA-wise LSQ

TL;DRL4Q 是一种参数高效的量化感知训练算法,利用 LLMs 中学到的低秩适应性量化步长,实现对高精度模型的同时量化和微调,达到亚 4 位精度并保持与应用 PEFT 在量化模型上相当的训练时间。