Jul, 2023
TensorGPT: 基于张量列车分解的 LLMs 嵌入层高效压缩
TensorGPT: Efficient Compression of the Embedding Layer in LLMs based on the Tensor-Train Decomposition
Mingxue Xu, Yao Lei Xu, Danilo P. Mandic
TL;DR本研究提出一种基于张量列分解的方法,将每个令牌嵌入视为可在分布式方式下有效计算的矩阵乘积状态,从而实现对令牌嵌入层的压缩,可达到高达 38.40 倍的压缩比,并在 3.31 倍的压缩因子下甚至比原始 GPT-2 模型效果更好。