Jun, 2023

BatchGNN:在非常大的图上高效的基于 CPU 的分布式 GNN 训练

TL;DRBatchGNN 是一个分布式 CPU 系统,可用于高效地在千兆字节级别的图形上训练图神经网络,通过在一个通信中绑定多个子图采样和特征提取以减少冗余特征提取、提供整合图分割和本地 GNN 层实现来提高运行时间,可以缓存聚合输入特征以进一步减少采样开销,相对于 DistDGL,GNN 的平均速度加快了 3 倍,在三个 OGBN 图表上训练的 GNN 模型优于分布式 GPU 系统 P3 和 DistDGLv2 的运行时间,并且可以扩展到千兆字节级别的图形。