Aug, 2024

基于凸优化的分层后训练剪枝方法用于大型语言模型

TL;DR本研究解决了现有大型语言模型剪枝方法需要低效再训练或性能下降的问题。本文提出的FISTAPruner是首个基于凸优化的后训练剪枝器,采用$\ell_1$范数诱导稀疏性,并利用FISTA求解器进行优化。实验表明FISTAPruner在多种语言基准上相较于现有最先进方法表现更优。