Feb, 2024

少即通用:一种面向大型语言模型的通用且简单的非参数剪枝算法

TL;DR基于核密度估计 (KDE) 的 KEN 是一种简单、通用且非结构化的修剪算法,旨在通过有选择性地保留最重要的参数并恢复其他参数到其预训练状态来构建优化的 Transformer 模型,这种方法在保持模型性能的同时只存储优化的子网络,从而实现显著的内存节省。在七个 Transformer 模型上的广泛评估表明,KEN 在最低参数减少 25% 的情况下实现了与原始模型相等或更好的性能。与其他修剪和 PEFT 算法的深入比较证实了 KEN 的有效性。此外,我们还介绍了 KEN_viz,这是一种可解释的工具,可以可视化 KEN 选择的优化模型构成和子网络。