Oct, 2020

亿级图的分布式图神经网络训练

TL;DR本文介绍了 DistDGL 系统,作为基于 Deep Graph Library(DGL)进行开发的图神经网络(GNN)的分布式训练系统,具有高效、可扩展性等优点。该系统采用了高质量且轻量级的最小割图划分算法,并支持非本地节点组成的自我网络进行小批量训练。经过优化后,该系统可以在线性速度下训练高质量的模型,并且在 16 台机器上只需 13 秒完成 100 万节点和 30 亿边数的图的训练。