BriefGPT.xyz
Ask
alpha
关键词
natural gradient sgd
搜索结果 - 1
使用模型平均法并行训练深度神经网络的实验
本研究针对深度神经网络(DNN)的并行训练使用模型平均方法。多 GPU 数据并行化,MPI 进行节点间通信,每隔几个 minibatches 进行模型平均。针对不同的学习速度、平均频率和 minibatch 尺寸探索最佳设置,研究发现 “N
→
PDF
9 years ago
Prev
Next