关键词mean-field weight initialization
搜索结果 - 1
  • ReLU MLP 中 $μ$P 学习率的深度依赖性
    PDFa year ago
Prev
Next