Jun, 2024

ALPS:面向大型语言模型的高度稀疏一次性修剪的改进优化

TL;DR本文介绍了一种名为 ALPS 的基于优化的框架,用于通过操作拆分技术和预条件共轭梯度后处理步骤处理修剪问题,并结合向量化和 GPU 并行性以提高效率,在修剪目标和困惑度降低方面远远超过现有方法,特别是对于高度稀疏的模型。在 OPT-30B 模型上,其稀疏度为 70%,ALPS 在 WikiText 数据集上实现了 13%的测试困惑度减少和比现有方法提高了 19%的零样本基准性能。