Sep, 2023

eDKM:一种高效准确的大型语言模型训练时权重聚类

TL;DR提出了一种内存高效的 Differentiable KMeans Clustering 实现,eDKM,通过新技术降低 DKM 的内存占用量,成功将预训练的 LLaMA 7B 模型从 12.6 GB 压缩到 2.5 GB,并在广泛的 LLM 基准测试中提供良好的准确性。