Q-Sparse: 所有大型语言模型可以完全稀疏激活

Jul, 2024

Q-Sparse: All Large Language Models can be Fully Sparsely-Activated

Hongyu Wang, Shuming Ma, Ruiping Wang, Furu Wei

TL;DR我们介绍了一种名为Q-Sparse的简单而有效的方法，用于训练稀疏激活的大型语言模型（LLMs），可以在推理过程中带来显著的效率提升。

Abstract

We introduce, q-sparse, a simple yet effective approach to training sparsely-activated large language models (LLMs). q-sparse enables full