BriefGPT.xyz
Ask
alpha
关键词
functional form
搜索结果 - 2
测量《深入理解》中的清晰度
神经网络中的感知现象被称为 grokking,本文提出了一种测量 grokking 的鲁棒技术,并基于拟合合适的函数形式进行研究,发现训练和验证准确性之间的突变趋势与绝对和相对锐度测量方法相似。
PDF
5 months ago
ICLR
神经缩放定律失效
研究了神经网络在多种任务中的扩展行为及其泛化预测模型,提出一种称为 BNSL 的平滑断电力法函数形式,相较于其他神经网络扩展行为函数形式,其推广的预测更加准确、准确地模拟和推广其他函数形式无法表达的特定情况下的不单调转折点和明显拐点扩展行为
→
PDF
2 years ago
Prev
Next