Jun, 2023

朝着对独立子网络训练的更好理论理解

TL;DR本文介绍了一种名为 Independent Subnetwork Training(IST)的高效神经网络模型并行化技术,其与压缩通信的分布式方法有着基本差异,在解决分布式大规模神经网络模型训练中的通信与计算问题上具有良好的优化性能。