Jun, 2024

Delta-CoMe: 大型语言模型的无需训练的混合精度增量压缩

TL;DR通过将细调的大语言模型进行分解和压缩,并采用混合精度的方法,我们提出了一个保持模型性能的增量量化方法,实验证明其在各种细调的语言模型中表现出与完整模型相当的性能,在低秩和低比特方法上也表现出明显优势,并且与其他基础语言模型兼容。