Nov, 2015

基于 FPGA 的循环神经网络硬件实现

TL;DR本文利用 Xilinx 公司的可编程逻辑器件 Zynq 7020 FPGA,实现了基于 Long-Short Term Memory(LSTM)的循环神经网络(RNN)硬件加速,并测试了该实现在字符级语言模型上的表现。结果表明,相较于 Zynq 7020 FPGA 中内嵌的 ARM CPU,该实现快了超过 $21$ 倍,并具有潜在的扩展到未来移动设备的应用前景。