Mar, 2022

不仅仅是玩具:随机矩阵模型预测现实世界神经表示如何泛化

TL;DR研究了机器学习模型泛化的定量现象,发现基于核回归的大规模神经网络和真实数据的核函数理论分析往往无法捕捉到这些现象,然而基于 GCV 估算器的实证研究结果表明该方法可以在这种超参数化的情境下准确预测泛化风险,并证明了 GCV 估算器在满足局部随机矩阵定理时总是可以收敛到泛化风险,最后应用这个随机矩阵理论解释了为什么预训练表示的泛化性更好以及什么因素支配了核回归的放缩定律,该研究揭示了随机矩阵理论对于理解神经表征的性质至关重要。