Sep, 2020

基于 FPGA 设计的基于 CNN 的目标检测器中混合数据流和混合精度的分层优化

TL;DR本文提出了一种针对卷积神经网络的硬件优化方案,该方案采用两种针对不同层次的特定优化法,实现不同的计算方式以提高性能,并在最大程度上减少了占用芯片的内存及对外部内存访问的需求,从而缓解了 CPU 的压力并大幅提升了处理速度。