关键词width
搜索结果 - 14
  • 通过图算法理解 Transformer 推理能力
    PDFa month ago
  • 深度和宽度对 Transformer 语言模型泛化的影响
    PDF8 months ago
  • 神经网络:深度、浅层,还是中间?
    PDF9 months ago
  • 特征学习网络在现实规模下的宽度一致性
    PDFa year ago
  • 使用复数深窄神经网络的通用逼近
    PDFa year ago
  • 深度学习中的鲁棒性:好(宽度),坏(深度)和丑陋(初始化)
    PDF2 years ago
  • 宽与深:自监督语音模型任务不可知知识蒸馏的学生网络架构分析
    PDF2 years ago
  • 光滑函数的深度网络逼近
    PDF4 years ago
  • MM神经切向核的有限深度和宽度修正
    PDF5 years ago
  • ICML神经网络过度参数化对梯度混乱和随机梯度下降的影响
    PDF5 years ago
  • 深度和宽度对深度学习局部最优解的影响
    PDF6 years ago
  • ICML神经网络应足够宽以学习不连续的决策区域
    PDF6 years ago
  • NIPS神经网络的表达能力:基于宽度的视角
    PDF7 years ago
  • 前馈神经网络的深度优势
    PDF9 years ago
Prev
Next