Sep, 2020
基于 FPGA 设计的基于 CNN 的目标检测器中混合数据流和混合精度的分层优化
Layer-specific Optimization for Mixed Data Flow with Mixed Precision in
FPGA Design for CNN-based Object Detectors
TL;DR本文提出了一种针对卷积神经网络的硬件优化方案,该方案采用两种针对不同层次的特定优化法,实现不同的计算方式以提高性能,并在最大程度上减少了占用芯片的内存及对外部内存访问的需求,从而缓解了CPU的压力并大幅提升了处理速度。