MMAug, 2017

利用序列桶技术和多 GPU 数据并行化加速循环神经网络的训练

TL;DR本研究提出了一种基于最佳批处理按输入序列长度和数据并行化的高效循环神经网络训练算法,以在线手写识别任务为例,通过比较不同数量桶的基准训练性能和提出的解决方案,考察了墙钟时间、纪元数和验证损失值等方面的评估结果。