BriefGPT.xyz
Ask
alpha
关键词
data parallelization
搜索结果 - 2
MM
利用序列桶技术和多 GPU 数据并行化加速循环神经网络的训练
本研究提出了一种基于最佳批处理按输入序列长度和数据并行化的高效循环神经网络训练算法,以在线手写识别任务为例,通过比较不同数量桶的基准训练性能和提出的解决方案,考察了墙钟时间、纪元数和验证损失值等方面的评估结果。
PDF
7 years ago
固定拓扑网络中的协作深度学习
本研究提出一种基于共识的分布式 SGD 算法,并使用 Lyapunov 方法分析其强凸和非凸目标函数的收敛性,能够支持数据并行和去中心化计算,适用于具有通信限制的本地数据的学习代理,实验表明该算法在 MNIST、CIFAR-10 和 CIF
→
PDF
7 years ago
Prev
Next