Feb, 2024

网络理解、双下降和应用能力的统一视角:来自电路竞争的观点

TL;DR最近的研究揭示了在深度学习中的一些有趣的现象,如 grokking、双下降和大型语言模型的新兴能力,这些现象挑战了人类的直观理解,对于更深入地理解神经模型至关重要。本文提出了一个全面的框架,提供了对这些现象的统一观点,着重于记忆和概括电路之间的竞争。我们的方法首先用于解释 grokking,并在我们的工作中扩展到更广泛的模型尺寸和训练数据量范围。利用这个框架,我们对双下降现象进行了详细分析,并提出了两个关于其出现的可验证预测,这两个预测都得到了我们的实验结果的证实。此外,我们将我们的框架扩展到多任务学习范式,展示了如何将算法任务转化为新兴能力,为理解大型语言模型中的新兴能力提供了一种新的视角。