Jun, 2023

语言模型压缩的低秩剪枝和分解

TL;DR利用网络剪枝与矩阵分解相结合的方式,提出了一种有效的预训练语言模型的模型压缩方法,通过新的初始化技术和训练过程优化技巧,能够在保持性能的同时实现更加高效的模型压缩。