May, 2024

NOVA: 基于片上网络的向量单元,用于在 CNN 加速器上映射注意力层

TL;DR本研究介绍了 NOVA,一种基于 NoC 的向量单元,可以在加速器的 NoC 中执行非线性操作,并能覆盖现有的神经加速器,以在边缘计算中映射注意力层。我们的结果表明,当运行现有的基于注意力的神经网络时,NOVA 体系结构比最先进的硬件逼近器高效节能,可提高功率效率高达 37.8 倍。