BriefGPT.xyz
Ask
alpha
关键词
large scale nlp training
搜索结果 - 1
大规模语言建模:在四小时内收敛于 40GB 文本
本研究开发出用于自然语言处理的基于 RNN 的 4096 维乘法 LSTM 模型,结合混合精度算法和大规模并行计算,使模型短短 4 小时内能在亚马逊评论数据集上通过三次训练实现无监督文本重构;同时,我们提供了一种学习率策略,使得该模型可以在
→
PDF
6 years ago
Prev
Next