Feb, 2019
DNNVM: FPGA-based CNN加速器上利用异构优化的端到端编译器
DNNVM : End-to-End Compiler Leveraging Heterogeneous Optimizations on
FPGA-based CNN Accelerators
TL;DR本文提出了用于深度学习框架的全栈编译器DNNVM,通过优化图表现形式、循环和数据布局、关键算法和支持验证等,将复杂的CNN模型转换成有向无环图(XGraph)并利用启发式子图同构算法枚举所有潜在的融合机会,并在全计算图中搜索执行策略的最佳选择, 在Xilinx ZU9 @330 MHz等设备上实现了与最新算法同等状态的性能,最终在VGG和ResNet50上达到了最先进的性能。