关键词layer-wise gradient normalization
搜索结果 - 1
  • 使用逐层自适应动量的随机梯度方法用于深度神经网络的训练
    PDF5 years ago
Prev
Next