Mar, 2024
神经网络推理对高数据速率、低延迟科学应用的架构影响
Architectural Implications of Neural Network Inference for High
Data-Rate, Low-Latency Scientific Applications
TL;DR科学领域越来越依赖于神经网络(NN)来处理大量数据的传入,而且延迟也很高,因此开发具有存储在芯片上的所有参数的NN非常关键。我们的研究表明,许多科学NN应用必须完全在芯片上运行,极端情况下需要自定制芯片来满足严格的约束条件。