Nov, 2020

探索在 Google TPUs 上进行 ML 训练的并发限制

TL;DR本文提出了一些技术来在 Google TPU Multipod 上扩展 ML 模型,讨论了模型并行处理,解决数据并行处理中批处理大小的扩展限制,以及一些性能优化方法,并用 TensorFlow 和 JAX 框架进行了演示,同时给出了 MLPerf-v0.7 竞赛结果,获得了四个 MLPerf 模型的最快训练时间记录。