Jan, 2024

Swing:用于高带宽 Allreduce 的捷径环

TL;DR改进 Torus 网络上的所有规约性能,引入了 Swing 算法,通过在 Torus 方向之间摇摆,保持通信节点之间的较低距离,从而实现了在不同类型的 Torus 和类 Torus 拓扑结构上优于现有的所有规约算法的性能,矢量范围从 32B 到 128MiB,无论其形状和大小。