Jun, 2024

ExCP:通过权重和动量联合缩小实现极限LLM检查点压缩

TL;DR本文提出了一种新的Extreme Checkpoint Compression(ExCP)框架,通过计算相邻检查点的残差和利用权重-动量联合收缩方法来压缩检查点的存储空间,并利用非均匀量化进一步减小存储空间,实现了大规模语言模型的高效训练和压缩。