Feb, 2018
深度学习系统的超高性能和能量效率:一种算法-硬件协同优化框架
Towards Ultra-High Performance and Energy Efficiency of Deep Learning
Systems: An Algorithm-Hardware Co-Optimization Framework
TL;DR本文旨在实现深度神经网络硬件实现的超高能效和性能,提出一种面向不同类型、大小和应用场景的DNN算法-硬件协同优化框架,并在硬件部分采用高效的FPGA实现,实验表明与IBM TrueNorth处理器和参考的FPGA实现相比,该框架至少实现了152倍的加速和71倍的能效增益。