Apr, 2024

CATGNN: 图神经网络的高效可扩展分布式训练

TL;DRCATGNN 是一个成本效益高且可扩展的分布式 GNN 训练系统,专注于在有限计算资源下扩展 GNN 训练到十亿规模或更大规模的图,并提出了一种名为 SPRING 的新型流式分区算法来进行分布式 GNN 训练。在 16 个开放数据集上验证了 CATGNN 与 SPRING 的正确性和有效性,尤其是证明了 CATGNN 能够处理最大的公开可用数据集,并在平均复制因子上显著优于最先进的分区算法 50%。