Sep, 2023

LORD:单语代码 LLM 的低秩分解用于一次性压缩

TL;DR通过 Low Rank Decomposition (LoRD) 来压缩大型语言模型(LLMs)以及用于单语代码生成,能够大幅减少参数,提供速度提升,并且保持可微分性和可训练性,且与现有高效浮点矩阵内核兼容,具备潜力提高模型压缩效果。