Oct, 2019

自动生成 FPGA 上的多精度多算术卷积神经网络加速器

TL;DR该研究提出了自动化生成高效CNN加速器的框架Tomato,并展示了在FPGA上运行的最先进的多精度多算术网络,不仅有效地减少了模型大小和计算复杂性,还可以将完整的ImageNet网络打包到单个FPGA上,并且与同类基于FPGA的竞争对手相比,延迟和吞吐量至少提高了2-4倍。