BriefGPT.xyz
Ask
alpha
关键词
automatic parallelism
搜索结果 - 2
UniAP: 统一的跨层和内层自动并行化方法:混合整数二次规划
深度学习模型的训练时间长依然是一个关键问题,提出了自动并行化来解决这个问题,并提出了 UniAP 方法来统一内部和外部自动并行化,实验证明 UniAP 在吞吐量上超过了现有方法 1.70 倍,并且减少了搜索时间 16 倍。
PDF
a year ago
TAP: 通过张量自动并行化加速大规模深度神经网络训练
本文提出了一种模型并行框架 TAP,利用神经网络作为有向无环图的性质,设计了一种图剪枝算法以高效地搜索最佳的数据和张量并行计划,实验表明 TAP 比现有自动并行化框架快 20-160 倍,并且其发现的并行化计划比专家设计的计划具有竞争力。
PDF
a year ago
Prev
Next