Jul, 2018

使用自动数据流图分区支持非常大的模型

TL;DRTofu 是一个系统,它可以将超大的 DNN 模型分割到多个 GPU 设备上以减少每个 GPU 的内存占用,该系统采用数据流图的方式透明地与 MXNet 等通用深度学习平台配合使用,通过一种描述算子语义的简单语言,实现自动划分。通过递归搜索算法来优化划分,并在 8-GPU 机器上的实验中展现了训练超大 CNN 和 RNN 模型的能力,在速度方面则比其他方法提高了 25% 至 400%。