BriefGPT.xyz
Ask
alpha
关键词
minibatch gradient descent
搜索结果 - 1
使用子矩阵进行高效的批次随机失活训练
研究探索了一种替代 dropout mask 的 dropout 技术,通过 batchwise dropout,可以应用于全连接和卷积神经网络中,通过使用 submatrix 的权重矩阵来执行矩阵乘法,减少了繁琐的计算过程,提高了训练效率
→
PDF
9 years ago
Prev
Next