BriefGPT.xyz
Ask
alpha
关键词
pipelining
搜索结果 - 2
通过重叠激活重计算优化大型模型训练
设计了一个新的重计算框架 Lynx,通过将重计算与训练管道中发生的通信重叠来减少开销,其中包括优化调度算法(OPT)和基于启发式的调度算法(HEU),OPT 实现了全局最优但搜索时间较长,HEU 通过应用相同调度策略于所有相同结构达到局部最
→
PDF
a month ago
可扩展自适应专家混合模型
Tutel is a highly scalable stack design for Mixture-of-Experts (MoE) with dynamically adaptive parallelism and pipelinin
→
PDF
2 years ago
Prev
Next