Aug, 2023
通过架构、编译器、分区方法共同设计加速通用图神经网络
Accelerating Generic Graph Neural Networks via Architecture, Compiler,
Partition Method Co-Design
TL;DR本文介绍了一种名为SwitchBlade的框架,通过新型分区级操作融合、分区级多线程和细粒度图分区等方法,实现了对图神经网络的高性能和高效能加速,相较于NVIDIA V100 GPU,SwitchBlade平均速度提升1.85倍,节能19.03倍,并且在性能上与最先进的专用加速器相媲美。