Aug, 2023

通过架构、编译器、分区方法共同设计加速通用图神经网络

TL;DR本文介绍了一种名为SwitchBlade的框架,通过新型分区级操作融合、分区级多线程和细粒度图分区等方法,实现了对图神经网络的高性能和高效能加速,相较于NVIDIA V100 GPU,SwitchBlade平均速度提升1.85倍,节能19.03倍,并且在性能上与最先进的专用加速器相媲美。