Jul, 2023

通过即时权重生成在 CNN 引擎中缓解内存瓶颈效应

TL;DR本文介绍了一种名为 unzipFPGA 的 CNN 推断系统,它通过引入权重生成模块实现了芯片上的实时权重生成,为小容量内存限制的层提供了更好的支持;此外,还介绍了一种自动化硬件感知的方法,将权重生成机制与目标 CNN 设备进行搭配,从而实现了更好的准确性和性能平衡;最后,还引入了一种输入选择性处理单元(PE)设计,平衡了子优化映射层的负载。该提议的框架在相同功耗约束下,与高度优化的 GPU 设计相比,实现了平均 2.57 倍的性能效率提升,同时在各种最先进的基于 FPGA 的 CNN 加速器中具有高达 3.94 倍的性能密度。