Sep, 2024

特征学习如何改善神经网络缩放法则

TL;DR本研究针对神经网络缩放法则在内核极限之外提出了一个可解模型,分析了模型大小、训练时间和可用数据总量如何影响性能。我们发现特征学习能够显著提高针对困难任务的缩放能力,提出了一种新的计算优化策略,以适应特征学习领域的参数和训练时间扩展。