Apr, 2024
CATGNN: 图神经网络的高效可扩展分布式训练
CATGNN: Cost-Efficient and Scalable Distributed Training for Graph
Neural Networks
TL;DRCATGNN是一个成本效益高且可扩展的分布式GNN训练系统,专注于在有限计算资源下扩展GNN训练到十亿规模或更大规模的图,并提出了一种名为SPRING的新型流式分区算法来进行分布式GNN训练。在16个开放数据集上验证了CATGNN与SPRING的正确性和有效性,尤其是证明了CATGNN能够处理最大的公开可用数据集,并在平均复制因子上显著优于最先进的分区算法50%。