关键词grokking
搜索结果 - 26
  • ICLR两个电路的故事:稀疏和密集子网络的竞争
    PDFa year ago
  • 统一理解学习和双重下降
    PDFa year ago
  • 通过激活函数的内在维度将正则化和泛化联系起来
    PDF2 years ago
  • Omnigrok: 超越算法数据的理解
    PDF2 years ago
  • MM弹弓机制:自适应优化器和领悟现象的实证研究
    PDF2 years ago
  • 理解 Grokking:表示学习有效理论的探究
    PDF2 years ago
Next