Aug, 2023

通过架构、编译器、分区方法共同设计加速通用图神经网络

TL;DR本文介绍了一种名为 SwitchBlade 的框架,通过新型分区级操作融合、分区级多线程和细粒度图分区等方法,实现了对图神经网络的高性能和高效能加速,相较于 NVIDIA V100 GPU,SwitchBlade 平均速度提升 1.85 倍,节能 19.03 倍,并且在性能上与最先进的专用加速器相媲美。