BriefGPT.xyz
Ask
alpha
关键词
neural cache
搜索结果 - 1
LSTM 语言模型的正则化和优化
介绍了一种使用 DropConnect 和 NT-ASGD 等方法进行 LSTM 正则化优化的模型,在 Penn Treebank 和 WikiText-2 数据集上取得了最佳的困惑度表现,并探索了神经缓存对模型性能的影响。
PDF
7 years ago
Prev
Next