ICMLMar, 2024
LookupFFN: 让 Transformer 在 CPU 推理中计算更轻巧
LookupFFN: Making Transformers Compute-lite for CPU inference
Zhanpeng Zeng, Michael Davies, Pranav Pulijala, Karthikeyan Sankaralingam, Vikas Singh
TL;DR通过研究 GEMM 基于前馈网络(FFN)的模块,我们提出了一种替代方案(称之为 LookupFFN),将大多数关键操作转化为内存查找,以减少所需的 FLOP,从而在 RoBERTa 语言模型预训练中实现类似性能。