Jan, 2024

语言模型压缩算法综述

TL;DR如何在不牺牲准确性的情况下压缩语言模型,本论文调查和总结了包括修剪、量化、知识蒸馏等在内的多样化压缩算法,并对其进行了深入分析,并根据我们的调查结果介绍了有前景的未来研究主题。