Apr, 2020

数据并行训练中的跨副本权重更新分片自动化

TL;DR该研究提出一种自动切分权重计算的方法,避免了权重变量维度不可切分而导致的性能和可扩展性问题。研究表明,这种技术在典型的图片和语言模型上都能显著提高性能,并帮助我们在 Google 的 MLPerf 0.6 竞赛中获得了表现最好的结果。