Apr, 2023

SwiftTron: 用于量化 Transformer 的高效硬件加速器

TL;DR本文提出了 SwiftTron,这是一种高效的专用硬件加速器,旨在支持量化 Transformer 的不同类型操作,并考虑了各种缩放因子以进行正确的计算,在 65 纳米 CMOS 技术中,RoBERTa-base 模型的加速器在 1.83 纳秒内执行,同时消耗 33.64 mW 的功率,占用 273 平方毫米的面积,可以缓解 Transformers 在资源受限的 EdgeAI /tinyML 设备上部署的挑战。