Feb, 2024

在 Transformer 中重用 Softmax 硬件单元进行 GELU 计算

TL;DR通过将 GELU 计算映射到 softmax 运算符,本文提出了一种在硬件中重新利用预设计的 softmax 硬件单元来计算 GELU 的方法,实验结果证明这种方法不会减少代表性自然语言处理应用的准确性,并且可以平均降低 6.1% 的硬件面积和 11.9% 的功耗。