Feb, 2024

L4Q:大型语言模型的参数高效量化感知训练:基于LoRA-wise LSQ

TL;DRL4Q是一种参数高效的量化感知训练算法,利用LLMs中学到的低秩适应性量化步长,实现对高精度模型的同时量化和微调,达到亚4位精度并保持与应用PEFT在量化模型上相当的训练时间。