BriefGPT.xyz
Sep, 2024
重新思考机器学习中的传统智慧:从泛化到扩展
Rethinking Conventional Wisdom in Machine Learning: From Generalization to Scaling
HTML
PDF
Lechao Xiao
TL;DR
本研究针对机器学习从以泛化为中心向以扩展为中心的转变所带来的问题,探讨了传统正则化原则在新模型扩展时代的适用性。研究提出了“扩展规律交叉”的新现象,表明小规模有效的方法在大规模模型中可能不再有效。这些发现为模型设计和比较提供了新的指导原则。
Abstract
The remarkable success of large language pretraining and the discovery of
Scaling Laws
signify a paradigm shift in
Machine Learning
. Notably, the primary objective has evolved from minimizing
→