Aug, 2016

RETURNN:RWTH 可扩展通用循环神经网络训练框架

TL;DR本文介绍了一种可扩展和易于配置的神经网络训练软件,该软件提供了丰富的功能层,特别关注在多个 GPU 上高效训练循环神经网络拓扑结构。该软件支持灵活配置,可用作框架或独立工具,能够训练最先进的深度双向长 - 短时记忆(LSTM)模型,并且已被用于开发成功的评估提交系统。