MMJun, 2024

多项式 LUT-Add:基于 FPGA 的宽输入 LUT 推理

TL;DR通过引入 PolyLUT-Add 技术,结合多个 PolyLUT 子神经元进行相加以提高准确性,并描述了一个提高可扩展性的新型架构,实验结果表明,在相似准确度的情况下,PolyLUT-Add 相比传统方法能够减少 1.3-7.7 倍的 LUT 使用量并降低 1.2-2.2 倍的延迟。