Aug, 2024

MoDeGPT: 大型语言模型压缩的模块化分解

TL;DR本研究解决了大型语言模型在资源有限设备上的部署困难,提出了一种新的模块化分解框架MoDeGPT,克服了传统压缩方法在准确性和参数开销上的缺陷。 MoDeGPT实现了高效的模型压缩,节省了98%的计算成本,同时在保持90-95%零-shot性能的情况下,将压缩率提升至25-30%。