Jul, 2024

FoldGPT:简单高效的大型语言模型压缩方案

TL;DR通过对不同层次的大语言模型进行研究,本文发现多数层次的输出存在显著的相似性,并且随着模型规模的增加,这种相似性更加明显。基于这种观察,我们提出了一种高效的模型体积压缩策略,称为 FoldGPT,该策略通过块删除和块参数共享来实现模型轻量化。实验证明,FoldGPT 在高效模型压缩方面优于先前的最新方法,证明通过简单的块删除和参数共享实现模型轻量化是可行的。