Jun, 2023

一款高效稀疏推断软件加速器,用于基于转换器的语言模型在CPU上

TL;DR本论文提出了一种基于定常块大小的高效稀疏深度学习推断软件堆栈,可以将稀疏加速器应用于Transformer-based语言模型,我们的稀疏加速器在处理各种GEMM形状时,比现有的稀疏库快一个数量级,在Xeon上具有高效的性能。