BriefGPT.xyz
大模型
Ask
alpha
关键词
distributed deep learning training
搜索结果 - 1
我们能学习高效通信优化器吗?
通过学习优化器的方法,本研究证明了学习优化器在保持通信高效性的同时,能够明显优于本地 SGD 及其衍生变体,甚至在未见过的更大规模数据集、架构(如 ImageNet 和 ViTs)以及语言模型等方面具有推广性,从而展示了学习优化器改进通信高
→
PDF
7 months ago
Prev
Next