BriefGPT.xyz
大模型
Ask
alpha
关键词
partition-level operator fusion
搜索结果 - 1
通过架构、编译器、分区方法共同设计加速通用图神经网络
本文介绍了一种名为 SwitchBlade 的框架,通过新型分区级操作融合、分区级多线程和细粒度图分区等方法,实现了对图神经网络的高性能和高效能加速,相较于 NVIDIA V100 GPU,SwitchBlade 平均速度提升 1.85 倍
→
PDF
a year ago
Prev
Next