Oct, 2017

在 Xilinx FPGA 上实现深度循环神经网络语言模型

TL;DR本论文研究了如何在单个 FPGA 平台上利用硬件加速器和 PYNQ 来实现 DRNN 语言模型加速,实验结果显示,在 PYNQ 板上 Overlay 加速器的 AXI Stream 接口性能为 20 GOPS,相较 Ref.30 和 Ref.31 的工作分别提高了 70.5 倍和 2.75 倍。