Jun, 2024

降低基于磁盘的 GNN 训练中的内存争用和 I/O 拥塞

TL;DRGNNDrive 通过综合的缓冲区管理和异步特征提取策略来最小化内存占用,避免内存和 I/O 的竞争,并充分利用软件和硬件资源。实验证明 GNNDrive 在 Papers100M 数据集上训练 GraphSAGE 模型时,比 SoTA PyG+、Ginex 和 MariusGNN 分别快 16.9 倍、2.6 倍和 2.7 倍。