May, 2024
NOVA: 基于片上网络的向量单元,用于在 CNN 加速器上映射注意力层
NOVA: NoC-based Vector Unit for Mapping Attention Layers on a CNN Accelerator
Mohit Upadhyay, Rohan Juneja, Weng-Fai Wong, Li-Shiuan Peh
TL;DR本研究介绍了 NOVA,一种基于 NoC 的向量单元,可以在加速器的 NoC 中执行非线性操作,并能覆盖现有的神经加速器,以在边缘计算中映射注意力层。我们的结果表明,当运行现有的基于注意力的神经网络时,NOVA 体系结构比最先进的硬件逼近器高效节能,可提高功率效率高达 37.8 倍。