BriefGPT.xyz
Ask
alpha
关键词
bottleneck stage
搜索结果 - 1
具备实际性能保证的深度神经网络推断的线程并行
通过将模型图分成 k 个阶段并减少瓶颈阶段的运行时间,我们通过最小化通信成本来优化深度神经网络(DNN)推理的流水线并行性。我们设计了针对这个 NP 困难问题的实际算法,并通过与通过新颖的混合整数规划(MIP)公式获得的强下界进行比较,证明
→
PDF
8 months ago
Prev
Next