Jun, 2023

基于低秩和稀疏逼近的大型语言模型的结构化压缩

TL;DR本文提出了一种新颖的模型压缩技术 LoSparse,该技术通过低秩矩阵和稀疏矩阵的加和来近似一个权重矩阵,结合了低秩逼近和剪枝的优点,避免了它们的局限性,在自然语言理解、问答和生成等任务中,它显著优于现有的压缩方法。