BriefGPT.xyz
Sep, 2024
特征学习如何改善神经网络缩放法则
How Feature Learning Can Improve Neural Scaling Laws
HTML
PDF
Blake Bordelon, Alexander Atanasov, Cengiz Pehlevan
TL;DR
本研究针对神经网络缩放法则在内核极限之外提出了一个可解模型,分析了模型大小、训练时间和可用数据总量如何影响性能。我们发现特征学习能够显著提高针对困难任务的缩放能力,提出了一种新的计算优化策略,以适应特征学习领域的参数和训练时间扩展。
Abstract
We develop a solvable model of
Neural Scaling Laws
beyond the kernel limit. Theoretical analysis of this model shows how performance scales with
Model Size
,
→