BriefGPT.xyz
Ask
alpha
关键词
distributed dl workloads
搜索结果 - 1
网络敏感深度学习的 GPU 集群调度
我们提出了一种新颖的 GPU 集群调度器,用于分布式深度学习工作负载,基于 DDL 作业对预期通信网络延迟的敏感性实现了基于邻近性的资源整合,通过经典的延迟调度算法来实现作业的放置和整合,使用数据驱动的 DDL 集群模拟平台进行了大规模实验
→
PDF
5 months ago
Prev
Next