MMOct, 2019

自动生成 FPGA 上的多精度多算术卷积神经网络加速器

TL;DR该研究提出了自动化生成高效 CNN 加速器的框架 Tomato,并展示了在 FPGA 上运行的最先进的多精度多算术网络,不仅有效地减少了模型大小和计算复杂性,还可以将完整的 ImageNet 网络打包到单个 FPGA 上,并且与同类基于 FPGA 的竞争对手相比,延迟和吞吐量至少提高了 2-4 倍。