GPT 压缩的 Kronecker 分解

Oct, 2021

Kronecker Decomposition for GPT Compression

Ali Edalati, Marzieh Tahaei, Ahmad Rashid, Vahid Partovi Nia, James J. Clark...

TL;DR本研究使用 Kronecker 分解压缩 GPT-22 模型的线性映射，并使用该技术训练得到一种新型的神经语言模型 KnGPT2，该模型在经过有效预训练后，可在具有相同参数数量的情况下，优于现有的 DistilGPT2 模型，在语言建模和通用语言理解评估基准任务上均取得了显著的成绩。

Abstract

gpt is an auto-regressive Transformer-based pre-trained language model which has attracted a lot of attention in the natural language processing (NLP) domain due to its state-of-the-art performance in several dow

gpt pre-trained language model model compression kronecker decomposition language understanding

发现论文，激发创造

KroneckerBERT: 通过知识蒸馏学习预训练语言模型的 Kronecker 分解

本文利用 Kronecker 分解技术对预训练语言模型进行压缩，在保证模型高通用性的同时，将模型大小压缩至原大小的 5%，并在多个 NLP 基准测试上实现更好的性能和全新的 out-of-distribution 鲁棒性表现。

Sep, 2021

TQCompressor：通过排列改进神经网络中的张量分解方法

我们介绍了一种新的神经网络模型压缩方法 TQCompressor，并使用改进的张量分解技术解决预训练语言模型在 NLP 任务中计算和存储需求方面的挑战。我们通过置换增强 Kronecker 分解，成功降低了模型表示能力的损失。我们将该方法应用于 GPT-2$_{small}$，得到了 TQCompressedGPT-2 模型。与 GPT-2$_{small}$ 的 124 百万参数相比，TQCompressedGPT-2 模型仅有 81 百万参数。我们公开提供了 TQCompressedGPT-2 模型。我们通过多步知识蒸馏的训练策略进一步提升了 TQCompressedGPT-2 的性能，仅使用 3.1％的 OpenWebText 语料库。在比较评估中，TQCompressedGPT-2 优于 DistilGPT-2 和 KnGPT-2，标志着在资源受限环境中高效有效地部署模型的进展。

Jan, 2024

基于 GPT 压缩的近似人类化少样本学习

利用生成式预训练模型进行信息压缩，估计少样本学习的最优信息距离，以及直接应用于定量文本相似性测量的方法。

Aug, 2023

TensorGPT: 基于张量列车分解的 LLMs 嵌入层高效压缩

本研究提出一种基于张量列分解的方法，将每个令牌嵌入视为可在分布式方式下有效计算的矩阵乘积状态，从而实现对令牌嵌入层的压缩，可达到高达 38.40 倍的压缩比，并在 3.31 倍的压缩因子下甚至比原始 GPT-2 模型效果更好。

Jul, 2023

FoldGPT：简单高效的大型语言模型压缩方案

通过对不同层次的大语言模型进行研究，本文发现多数层次的输出存在显著的相似性，并且随着模型规模的增加，这种相似性更加明显。基于这种观察，我们提出了一种高效的模型体积压缩策略，称为 FoldGPT，该策略通过块删除和块参数共享来实现模型轻量化。实验证明，FoldGPT 在高效模型压缩方面优于先前的最新方法，证明通过简单的块删除和参数共享实现模型轻量化是可行的。

Jul, 2024

知识图谱嵌入的克罗内克分解

本文基于 Kronecker 分解技术提出了一种方法来减少知识图嵌入模型中的参数数量，拥有更好的参数效率、特征重用和对输入噪声的鲁棒性，在基准数据集上进行了一系列实验表明其有效性。

May, 2022

使用张量列车矩阵表示的高效 GPT 模型预训练

本研究通过将全连接层的矩阵替换为相应的张量列车矩阵结构以减少 GPT-2 体系结构的参数数量，并提出了一种可扩展的张量化层，以提高模型效率和最终模型的稳定性。

Jun, 2023

SliceGPT：通过删除行和列来压缩大型语言模型

SliceGPT 是一种新的后训练稀疏化方法，可以将模型的参数减少 25％，同时保持密集模型的 99％，99％和 90％的性能，并减少内存和计算需求。

Jan, 2024

mGPT: 少样本学习器转向多语言

本文介绍了两种自回归 GPT 类模型，使用维基百科和 Colossal Clean Crawled Corpus 训练了 60 种语言、25 种语言系的搜索，展示了多种任务上的表现，包括分类、生成、序列标记和知识探测，在多语种任务上有着与 Facebook 最近发布的 XGLM 模型相媲美的表现。

Apr, 2022

探索预训练语言模型的极端参数压缩

探索利用张量分解实现更大的压缩比率来压缩 BERT 模型的研究，取得了可接受的性能损失并显著提高了推理效率，最高压缩至原模型的 1/48，且在 GLUE 基准测试中取得了与原模型相当或略优的表现，该方法相对于蒸馏等现有的压缩方法独立有效。

May, 2022