Jul, 2024

Q-Sparse: 所有大型语言模型可以完全稀疏激活

TL;DR我们介绍了一种名为Q-Sparse的简单而有效的方法,用于训练稀疏激活的大型语言模型(LLMs),可以在推理过程中带来显著的效率提升。