Jun, 2023

KAPLA:可扩展神经网络加速器数据流的实用表示和快速求解

TL;DR本文提出了面向可扩展多节点神经网络体系结构上的时间和空间调度的综合性和实用性数据流表示,利用一组形式化的张量中心指令,构建出一个通用、优化和快速的数据流求解器 KAPLA,它在训练和推理中实现了 2.2% 和 7.7% 的能耗开销,并且在效果和速度上胜过了随机和基于机器学习的方法。