MMJul, 2018

面向神经网络推理加速的编译器和 FPGA 叠加

TL;DR本研究介绍一种针对深度神经网络推理的覆盖层,通过引入一种轻量级的超长指令字(VLIW)网络支持控制和重新编程逻辑,以及实现了一个复杂的特定领域的图形编译器,以显著提高 CNNs/RNNs 的性能,最终在 Intel Arria 10 1150 上实现了~900 fps,并且对比以往研究,在性能方面有了巨大的进步。