Mar, 2018

TicTac: 使用通信调度加速分布式深度学习

TL;DR本文提出了一种名为 TicTac 的参数服务器的分布式深度学习系统,通过固定参数的接收顺序,实现了前后网络传输重合的近乎最优状态。在 TensorFlow 上实现的 TicTac 可以提高推理和训练吞吐量最多分别达到 37.7% 和 19.2%,同时减少了 straggler 效应。