May, 2024

高稀疏性基础Llama模型的高效预训练和部署

TL;DR通过稀疏性,我们能够以较小的模型实现更快的训练和推理加速,并且不牺牲准确性。