Nov, 2024

基于大容量内存的FPGA的高效消息传递架构用于GCN训练,具有正交拓扑芯片网络

TL;DR本研究解决了图卷积网络(GCN)在训练过程中受到内存容量和带宽限制以及不规则数据流导致的通信瓶颈的问题。提出的消息传递架构利用NUMA内存访问特性,结合基于四维超立方体网络的并行多播路由算法,显著降低了内存需求和计算开销,并对现有的HP-GNN架构实现了1.03至1.81倍的性能提升。