Aug, 2024

无训练的大型语言模型激活稀疏性

TL;DR本研究解决了大型语言模型激活稀疏性在提高推理速度方面的普遍应用瓶颈。提出了一种名为TEAL的简单无训练方法,通过对整个模型的隐藏状态应用幅度基础的激活稀疏性,显著提升了稀疏性水平且几乎不降低性能。该方法在不同规模的模型上实现了更高的解码速度,有助于提升推理效率。