BriefGPT.xyz
Ask
alpha
关键词
generalization process
搜索结果 - 1
从稳健性视角理解揣摩探究
我们研究了神经网络中的一种异常现象叫做 “grokking”,发现使用 $l_2$ 权重范数和鲁棒性观点可以解释、测量和加速这一现象,同时研究发现在测试数据上,新的基于鲁棒性和信息理论的度量指标与 “grokking” 现象具有较好的相关性
→
PDF
8 months ago
Prev
Next