Jan, 2024

BETA: 边缘二值化能效优化的 Transformer 加速器

TL;DR通过优化计算顺序和引入高度并行性和高速的 QMM 引擎,本文提出了一种基于二进制 Transformer 的能效较高的加速器 BETA,实验证明,BETA 在边缘部署中能够实现 174 GOPS/W 的平均能效,比之前基于 FPGA 的加速器高出 1.76~21.92 倍,显示了 BETA 在边缘 Transformer 加速方面的巨大潜力。