Aug, 2024

高效边缘人工智能:使用Gemmini加速器在FPGA上部署卷积神经网络

TL;DR本研究解决了在边缘设备上部署卷积神经网络(CNN)的复杂性和劳动强度问题。通过开发一个端到端的工作流程,利用Gemmini加速器和开源软件优化部署过程,研究显示在Xilinx ZCU102 FPGA上部署YOLOv7模型可实现实时性能和36.5 GOP/s/W的能效表现,显著优于其他嵌入式硬件设备。此方案在交通监控场景中的应用展示了其广泛的潜在影响。