Jun, 2023

BatchGNN:在非常大的图上高效的基于CPU的分布式GNN训练

TL;DRBatchGNN是一个分布式CPU系统,可用于高效地在千兆字节级别的图形上训练图神经网络,通过在一个通信中绑定多个子图采样和特征提取以减少冗余特征提取、提供整合图分割和本地GNN层实现来提高运行时间,可以缓存聚合输入特征以进一步减少采样开销,相对于DistDGL,GNN的平均速度加快了3倍,在三个OGBN图表上训练的GNN模型优于分布式GPU系统P3和DistDGLv2的运行时间,并且可以扩展到千兆字节级别的图形。