BriefGPT.xyz
Feb, 2021
传递的尺度定律
Scaling Laws for Transfer
HTML
PDF
Danny Hernandez, Jared Kaplan, Tom Henighan, Sam McCandlish
TL;DR
研究表明,使用预训练模型进行迁移学习可以在未标注数据上改善性能,通过研究参数、数据和计算等方面,得到了一系列可预测的缩放规律。
Abstract
We study empirical
scaling laws
for
transfer learning
between distributions in an
unsupervised
, fine-tuning setting. When we train increas
→