Jun, 2024

FRED: 适用于芯片尺度分布式深度学习模型训练的灵活缩减分发互连和通信实现

TL;DR提出了FRED,这是一个面向片上网络的高带宽要求而量身定制的片上互连,可有效执行不同并行化策略的通信模式,并且通过大约2倍降低网络流量,改善了ResNet-152,Transformer-17B,GPT-3和Transformer-1T的平均端到端训练时间。