BriefGPT.xyz
Ask
alpha
关键词
stacklstm
搜索结果 - 1
ACL
可并行的堆栈长短期记忆
本文研究了如何利用 Stack Long Short-Term Memory (StackLSTM) 的状态访问模式来优化 GPU 训练,将不同的离散操作同质化。实验结果表明,该方法在批处理大小增加时具有几乎线性的可扩展性,而我们的 PyT
→
PDF
5 years ago
Prev
Next