Jul, 2023

TensorGPT: 基于张量列车分解的 LLMs 嵌入层高效压缩

TL;DR本研究提出一种基于张量列分解的方法,将每个令牌嵌入视为可在分布式方式下有效计算的矩阵乘积状态,从而实现对令牌嵌入层的压缩,可达到高达 38.40 倍的压缩比,并在 3.31 倍的压缩因子下甚至比原始 GPT-2 模型效果更好。