ICMLMar, 2024

LookupFFN: 让 Transformer 在 CPU 推理中计算更轻巧

TL;DR通过研究 GEMM 基于前馈网络(FFN)的模块,我们提出了一种替代方案(称之为 LookupFFN),将大多数关键操作转化为内存查找,以减少所需的 FLOP,从而在 RoBERTa 语言模型预训练中实现类似性能。