May, 2023

探索神经网络的现象学理解:数据

TL;DR从集成变量构建的神经网络理论可以帮助科学家更好地理解学习过程。本研究引入了熵和经验神经切向核(NTK)的迹这两个变量,通过这些变量分析神经网络性能,发现起始熵、NTK 迹和训练后计算的模型泛化之间存在相关性。同时,将该框架应用于神经网络训练的最优数据选择问题,使用随机网络蒸馏(RND)来选择训练数据,并与随机选择数据进行比较。结果表明,RND 选择的数据集不仅能够胜过随机选择,而且相关的集成变量也更大。该研究为神经网络训练数据的选择提供了稳定的理论基础。