May, 2024

gzip 预测数据相关的缩放规律

TL;DR通过改变数据复杂性的方式生成不同复杂性的训练数据集,发现参数和训练数据量的缩放规律对数据复杂性非常敏感,并且发现 gzip 压缩算法能够有效预测数据复杂性对性能缩放规律的影响,提出了一个新的与数据相关的神经语言模型缩放规律,该规律考虑到了训练数据的 gzip 可压缩性,当训练数据难以压缩时,数据集大小优先于参数数量的计算最优边界增加。