Jun, 2022

SALO: 一种高效的空间加速器,支持长序列的混合稀疏注意机制

TL;DR本文提出了一种名为 SALO 的加速器,能够使得 Transformer 等注意力机制在处理长序列时具有更好的性能,并通过实验证明 SALO 相比于典型工作负载下的 GPU 和 CPU 实现,分别具有 17.66 倍和 89.33 倍的加速比。